Süni intellekt və musiqi
Yaradıcı alət yoxsa sənətçinin
əvəzçisi?
Musiqi mədəniyyətin ən
qədim və eyni zamanda ən
emosional ifadə vasitələrindən biridir.
Musiqi insanın daxili aləmini, duyğularını, düşüncələrini
əks etdirən bir dil, bir
sənət formasıdır.
Tarix boyu musiqi insanın yaradıcılıq təxəyyülünün
məhsulu olmuş, ifaçının şəxsi
hiss və düşüncələri ilə
həyat tapmışdır.
Amma texnologiyanın inkişafı ilə bu sahəyə yeni oyunçu daxil olur: süni
intellekt. Süni intellekt alqoritmlər, böyük verilənlər
bazası və statistik modellər vasitəsilə işləyən
proqram təminatıdır.
Son illərdə alqoritmlər cəmiyyətin
bütün sahələrinə
təsir göstərib
və bu sahələrdən biri də musiqidir. Hazırda süni intellekt müxtəlif janrlarda musiqi yarada bilir, məşhur
ifaçıların səslərini
təqlid edir, hətta dinləyicinin fərdi zövqünə
uyğun melodiyalar təqdim edə bilir. Bəzi proqramlar bir neçə dəqiqə
içində tamamilə
yeni kompozisiyalar hazırlayır və onları dərhal yaymaq mümkündür. Bu proses musiqi
sənətinin gələcəyi
üçün ciddi
suallar doğurur. Süni intellekt sənətçiyə yardımçı
vasitə kimi xidmət edəcək, yoxsa insan yaradıcılığının
yerini alacaq? Yaradıcılığın emosional
tərəfi alqoritmlərlə
əvəz oluna bilərmi?
Qara Qarayev
adına Mərkəzi
İncəsənət məktəbinin
nəzəriyyə şöbəsinin
müəllimi, musiqişünas
Pərvin Səfərli
Olaylar.az-a açıqlamasında deyib
ki,bu məsələ
son dövrlərdə
olduqca aktualdır. Süni intellekt sahəsi keçən əsrin ortalarında yaranıb, lakin son illərdə çox geniş inkişaf edərək artıq real tətbiq mərhələsinə
keçib. Bu texnologiya təkcə iş yerlərimizi deyil, ailə həyatımızı və
ictimaiyyətin digər
sahələrini, o cümlədən
yaradıcılığı da əhatə edir:" Ancaq yaradıcılıq anlayışının
öz adından da göründüyü kimi, o, ilk növbədə
ruhla bağlıdır.
Ruhun və intellektin vəhdətindən
yüksək sənət
nümunəsi yaranır.
Musiqidə də süni intellektdən istifadə etmək mümkündür, lakin musiqi sənəti və musiqi peşəkarlığı tamam
başqa anlayışlardır.
Peşəkar qulağı
heç vaxt aldatmaq mümkün deyil. Əgər sən peşəkar sənətlə məşğul
olursansa, bu sənətin dərinliyi və incəliyinı hakimsənsə, burada aldanmaq mümkün deyil. İnsan faktoru-insanın düşüncəsi,
fikirləri, daxili aləmi və ruhu yaradıcılığın
əsasını təşkil
edir. Bədii əsər insanın ruh, intellekt, dünyagörüşü, həyat
təcrübəsi, hadisələri
qavrama və onları yaradıcılıq
süzgəcindən, bədii
təfəkkür prizmasından
keçirərək ortaya
qoyduğu bir sənət nümunəsidir.
Söhbət burada konkret olaraq sənətdən, peşəkar
sənətdən gedir.
Musiqi çoxşaxəli
bir sənətdir: kino musiqisi var,
pop musiqisi, ciddi, yüngül musiqi növləri və s. mövcuddur. Bir çox sahələrdə süni
intellekt insanı əvəz edə bilər. Ancaq burada söhbət musiqi sənətindən gedir. Məsələn, kino musiqisini götürək. Kino musiqisi əsasən dekorativ xarakter daşıyır, obraz və hadisələri müşaiyət edir. Bəli, elə musiqi nümunələri yaradıla bilər ki, süjeti tamaşaçıya yüksək
səviyyədə təqdim
etsin. Artıq qulağımız Hollywood
filmlərinin musiqisinə
öyrəşib, bu xüsusda müəyyən
bir model formalaşıb. Filmin musiqisi müəyyən streotip üzərində qurulur, hər bir səhnəyə özəl bir musiqi dili var
və biz bu musiqi dilini
başa düşüb
qəbul edirik. Bu, konveyer vasitəsilə
yaranan musiqidir. Lakin sizə kino musiqisini yüksək sənət nümunəsi kimi göstərən bir misal təqdim edim. Q.Qarayev rejissor
Q. Kozintsevin "Don Kixot"
filminə musiqi yazmışdır. Rejissor
öz xatirələrində
bildirir: "Mən heç vaxt filmlərimin efir nümayişinə baxmıram.
Televizorda "Don Kixot"
filminin növbəti dəfə nümayiş etdirirdilər. Mən durub otaqdan çıxmaq
istədim, Lakin Qarayevin
musiqisi məni dayanmağa məcbur etdi və mən
sırf musiqiyə görə filmə tamaşa etdim" Bax, bu musiqi
artıq sırf dekorativlikdən, müşaiyətdən
çıxaraq fərdi
bir əsər kimi təzahür edir. Təsadüfi deyil ki, Q.Qarayev
filmin musiqisi əsasında simfonik qravürlər yazmış
və ona simfonik həyat vermişdir.
Peşəkar sənətə gəldikdə...
Musiqidə elə qanunauyğunluqlar var ki, süni
intellekt onları yerinə yetirə bilmir. Bəstəkar bir ideya təqdim
edir, onun musiqi forma və məzmununu təyin edir, müəyyən bir quruluş yaradır. Məsələn,
klassik musiqi formaları içərisində
sonata-Alleqro forması,
klassik musiqi janrları arasında simfoniya janrı var ki, bunlar həyati konfliktlərin, təzahürlərin
bədii modeli kimi ən tutarlı
forma və məzmuna malikdirlər. Məsələn, sonata formasında
iki əsas mövzu verilir - həyatın əsasən
iki müxtəlif yönümünü, əks
qütbləri əks
etdirən iki mövzu. Bu mövzular əsərin inkişafı
zamanı qarşıdurmalara,
dəyişikliklərə məruz qalır. Bu proses isə yalnız bəstəkara, yaradıcı
ruha məxsus yolla aparılır. Onun həyat təcrübəsindən, dünyaya,
hadisələrə baxış
prizmasından keçirilərək.
Burada dramaturgiya məsələsi var-ideyanın
musiqi vasitəsilə
dramaturji baxımdan necə təqdim olunması və həll olunması. Hər bəstəkar bunu fərqli şəkildə edir və bu fərqlilik,
peşəkarlıq ortaya
sənət nümunəsi
qoyur.
Müasir
musiqi sənətinin də öz forma və məzmunu, fərqli dramaturgiyası və musiqi dili var. Çünki nə qədər insanın yaradıcı ruhu var, bir o qədər də yeni üslub və cərəyanlar ortaya çıxır.
Süni
intellekt tərəfindən
yazılmış musiqi
nümunələrini dinlədikdə
görürəm ki, bir
mövzu qoyulur, lakin o inkişaf etmir, cüzi dəyişikliklərlə əsər
sona çatır. Bəstəkar musiqisi belə olmur. Bəstəkar musiqisində
mövzu dəyişir,
həyat konfliktlərini
əks etdirir və bizi kulminasiyaya
aparır. Müxtəlif
növ dramaturgiya və onun mərhələləri
var: problem qoyulur və
həll edilir. Süni intellekt bunu edə bilmir.
Peşəkar musiqi prosesində mövcud olan təfəkkür, yaradıcılıq və
musiqi düşüncəsi
süni intellektdə yoxdur. Ona görə də deyirəm ki, yaradıcı, peşəkar
qulağı süni intellekt aldada bilmir. O, yalnız bəzi tərəfləri
verə bilir, lakin zənginliyi təqdim edə bilmir. Bəsit nümunələr yaradır,
melodiyanı məntiqsiz
qurur, üslubları qarışdırır, amma
bunu peşəkar səviyyədə etmir. Çünki peşəkar
səviyyədə üslub
qarşılaşdırmaları məsələsinə ciddi
yanaşılır. Süni
intellekt verilmiş proqram, modellər əsasında işləyir,
yaradıcı insan isə hansı bazadan çıxacağını,
hansı texniki və peşəkar mərhələlərdən keçəcəyini
fərdi olaraq özü müəyyən
edir və nəticədə bədii
əsər ortaya çıxır. Süni
intellektdə bu proses yoxdur.
Düzdür, müxtəlif eksperimentlər
aparılıb və süni intellekt musiqisi dinləyicilərə
təqdim edilib. Amma zalda oturan dinləyicilər
peşəkar qulağa
malik deyillər. Onlar yalnız intonasiya bazasını eşidirlər,
musiqinin daxili zənginliyini duya bilmirlər. Müəyyən
səviyyədə aldadılırlar,
amma peşəkar səviyyədə yox. Çünki əsər zahiri prosesdən ibarət deyil, onun daxili prosesi
var. Bu, roman oxumağa bənzəyir:
paralel xətlər, konfliktlər, personajların
qarşıdurmaları. Əsərin
bədii yükü və keyfiyyəti süni intellekt tərəfindən heç
vaxt tam şəkildə
yaradıla bilməz. Gələcəkdə nə
baş verəcəyini
görəcəyik, amma
indiki mərhələdə
musiqi baxımından
süni intellekt mənim üçün qorxulu deyil. Kino, pop və yüngül xarakterli musiqi sahələrində istifadə
oluna bilər, burada biznes tərəfi
də böyükdür.
Amma sənət sahəsində
işləməyəcək. Digər tərəfdən,
bu proqramların peşəkar və qeyri-peşəkar səviyyələri
var. Daha çox ödəniş tələb
edən proqramlar daha peşəkar tətbiqlərdir və onlardan əsasən peşəkar musiqiçilər
istifadə edə bilər. Məncə, yeni
texnikalar yaradıcı
insanın əlinə
düşəndə çox
faydalı ola bilər.
Yaradıcı insan bu texnikaları öz ideyalarına köməkçi kimi istifadə edə bilər. Bu vasitələrdən
düzgün istifadə
edərək yeni, innovativ
ideyalar ortaya çıxarmaq mümkündür.
Məsələn, gələcəkdə
dinləyici ilə ifaçı arasında neyro-bağlantı yarana və bu bağlantı
vasitəsilə musiqi
əsərləri formalaşa
bilər. Müasir texnologiyalar artıq insan düşüncələrini
və hisslərini birbaşa musiqiyə çevirmək imkanlarını
ortaya qoyur. Amma bu imkanlar yenə
də yaradıcı insanın əlində olmalıdır.
Süni
intellekt indiyə qədər yaranmış
musiqi bazasından, intonasiya və ifadə vasitələrindən
istifadə edir. O, mövcud bazanı qarışdıraraq nəsə
təqdim edir və bu, orijinal
olmur. Sənət orijinallıq, individuallıq
tələb edir. Bu, mənim sırf musiqişünaslıq baxışımdır.
Mənim çox sevdiyim politoloq İrina Xakamarda da deyir ki, süni intellekt gələcəkdə bizi
bir çox sahədə əvəz edə bilər, amma yaradıcılıq sahəsində yox. Çünki yaradıcılıq
ruhu Allahın verdiyi ruhdur-unikaldır, təkrar olunmazdır.
İnsan
gərək səmimi
olsun. Səmimiyyət
dedikdə nəyi seçdiyimiz vacibdir: canlınımı seçirik,
yoxsa cansızımı?
Təəssüf ki, dövr
bizi canlı ilə cansız arasındakı fərqin azaldılmasına doğru
aparır. Bu fərqi itirməmək lazımdır.
İki nümunə təqdim olunsa- süni intellekt musiqisi və canlı insan musiqisi-ilk dəqiqələrdə
fərqi anlamaq çətin ola bilər.
Amma sonra insan qulağı, duyumu bu fərqi tutacaq.
Hələ ki, tutacaq.
Gələcəkdə texnologiya
o səviyyəyə çata
bilər ki, bu fərqi hiss etmək çox çətin ola bilər. İnsan isə indidən öz seçimini etməlidir: hansı amilə daha çox üstünlük
vermək- insan ruhuna və intellektinəmi, onun ortaya qoyduğu məhsulamı, yoxsa cansız alətin.... Fikrimcə, müasir dövrümüzdə cəmiyyət,
fərdiyyət böyük
bir seçim qarşısındadır. Əgər
biz indi seçim etməsək, gələcəkdə
bizim özümüzün
seçimə məruz
qalacağımız labüddür.
Mən texnologiyanın
inkişafının əleyhinə
deyiləm. Əksinə,
onun bizə yeni üfüqlər aça
biləcəyi fikrindəyəm.
Lakin bu insan ruhunun, yaradıcılığının
ziddinə, əleyhinə
olmamaq şərtilə... Arzu edirəm ki, insanlar daha çox canlı ünsiyyəti, yaradıcılığı və
insan ruhunu seçsinlər".
Süni intellekt musiqi yaradan zaman hansı əsas texnologiyalardan və məlumat bazalarından istifadə edir və bu
proses insan yaradıcılığı
ilə texniki baxımdan nə dərəcədə müqayisə
oluna bilər? Alqoritmlərin tanınmış
ifaçıların səsini
və üslubunu təqlid etməsi texniki baxımdan nə qədər təhlükəsizdir və
bu, gələcəkdə
musiqi sənayesində
hansı riskləri yarada bilər? AI mütəxəssisi, Alas Academy direktoru Natiq Məmişovin fikrincə
süni intellekt musiqi yaradarkən bir neçə əsas texnologiyaya əsaslanır:"Birinci
istiqamət neyron audio
kodeklərdir (audio → "token" çevrilməsi). Müasir
sistemlərin əksəriyyəti
səsi birbaşa dalğa forması kimi emal etmir.
Audio əvvəlcə "sıxılmış" diskret
kodlara - tokenlərə
çevrilir. Məsələn,
SoundStream kimi neyron kodeklər audionu encoder/decoder və kvantlaşdırma mexanizmi
ilə kodlaşdırır.
İkinci
texnologiya Transformer əsaslı
"dil modeli" yanaşmasıdır. Bu mərhələdə
tokenlər artıq musiqinin bir növ
"əlifbası" kimi
davranır. Model bu
token ardıcıllığını növbəti tokeni proqnozlaşdırmaq prinsipi
ilə generasiya edir. MusicGen bu yanaşmanın klassik nümunəsidir.
Üçüncü istiqamət
diffusion modelləridir, xüsusən
də "latent" məkanda
işləyən sistemlər.
Bəzi "text-to-audio" və "text-to-music" modelləri
səsin latent təmsilində
səs-küyü mərhələli
şəkildə "təmizləyərək"
audionu formalaşdırır.
Stable Audio Open bu prosesi
açıq şəkildə
autoencoder, mətn embedding-ləri
və latent-space diffusion transformer (DiT) kombinasiyası kimi təsvir edir.
Dördüncü əsas məqam
şərtləndirmədir (conditioning). Model
təsadüfi musiqi yaratmır, adətən mətn promptları ilə şərtlənir.
Bu promptlara janr, ovqat (mood), tempo, alətlər
və mövzu daxildir. Bəzi hallarda isə melodiyalar, ritm və akkordlar kimi idarəedici siqnallar da istifadə olunur.
Məlumat bazaları nədən
ibarət olur?
Böyük həcmdə audio treklər
+ metadata: janr, tempo, alətlər,
etiketlər; bəzən
mətn təsviri və ya "tag"lər. Bəzi modellər Creative Commons kimi
açıq lisenziyalı
datasetlərə fokuslanır
(məs: Stable Audio Open-un fərqli
dataset yanaşması).
İnsan
yaradıcılığı ilə texniki müqayisə necədir? Oxşarlıq ondan ibarətdir ki, həm insan, həm də süni intellekt dinlədiyi və öyrəndiyi nümunələrdən stil,
harmoniya, ritm və forma qanunauyğunluqlarını
mənimsəyir. Fərq
isə ondadır ki, insan "niyə bu hissəni belə etdim?" sualına məqsəd, kontekst, emosional niyyət və şəxsi həyat təcrübəsi ilə
cavab verir. Süni intellekt isə əsasən ehtimallar üzərindən
"ən uyğun davam"ı qurur. Praktik nəticədə
AI çox vaxt demo, prototip və ideya generatoru kimi güclü olur. "İmza" yaradıcılığı, dərin
məna və kontekst uyğunluğu isə hələ də ən stabil şəkildə insanda qalır".
Tanınmış ifaçıların səsini və üslubunu təqlid etmək nə qədər təhlükəsizdir?
Natiq Məmişov bildirir ki, bu, texniki baxımdan təhlükəsiz sayılmır.
Çünki səs biometrik kimlikdir:
"Səs klonlaşdırılması
və impersonasiya təkcə musiqi məsələsi deyil, identifikasiya və etibar məsələsidir.
Platformalar da bunu risk kimi qiymətləndirir. Məsələn, Spotify 2025-ci ildə
icazəsiz səs klonu və impersonasiya
ilə bağlı siyasətini sərtləşdirib
və bu cür kontentin silinəcəyini açıqlayıb.
Sənaye riskləri
real ssenarilərlə özünü
göstərir.
Bunlara impersonasiya və reputasiya zərəri daxildir: "filan artist yeni
mahnı buraxdı"
görüntüsü ilə
saxta buraxılışlar.
Digər risk royalti fırıldağı və
spam selidir. Platformalara
kütləvi şəkildə
AI musiqisi yüklənir.
Spotify son 12 ayda 75 milyon
AI spam trek sildiyini açıqlayıb.
Bundan əlavə, hüquqi və etik mübahisələr
mövcuddur: hansı hallarda bu, sadəcə
üslub təqlididir,
hansı hallarda isə səs kimliyinin oğurluğu sayılır? Bu sərhəd
getdikcə daha konfliktli olur. Dinləyicinin aldadılması
və "deepfake audio" ilə bağlı şəffaflıq problemi
də ciddi risklər arasındadır".
Ekspert qeyd edir ki, süni
intellekt musiqi nəzəriyyəsinin qaydalarını
əl ilə tətbiq etmir. O, böyük həcmdə məlumatdan statistik və struktur pattern-ləri öyrənir və onları yeni kombinasiyalarda "sample" edir:
"Bu texnologiyanın inkişafında
əsas risklər nələrdir? Birinci risk hüquq və razılıq məsələsidir.
Datasetlərin lisenziyası,
artistlərin səsinin
və tembrinin icazəsiz istifadəsi, müəlliflik hüquqları
və gəlir bölgüsü bu kateqoriyaya daxildir.
İkinci
risk impersonasiya, fırıldaqçılıq
və dezinformasiyadır.
Saxta artist buraxılışları,
saxta duetlər, şantaj və reputasiya hücumları
buna nümunədir. Platformaların
siyasəti sərtləşdirməsi
də məhz bununla bağlıdır.
Üçüncü risk bazarın kontent seli ilə
keyfiyyətsizləşməsidir. Kütləvi AI musiqi yüklənməsi dinləyici
üçün axtarışı
çətinləşdirir, real artistlərin görünürlüğünü
azalda bilər və spam, royalti sui-istifadəsini artırır.
Dördüncü risk şəffaflıq və etiketləmə ilə bağlıdır.
AI ilə yaradılan kontentin açıq şəkildə işarələnməsi,
dinləyicinin aldadılmaması
üçün tənzimləmələr
aparılır.
Beşinci risk isə yaradıcılıq
ekosisteminə təsirdir.
"Səs və üslub bazarı" formalaşır- kimlik və üslub lisenziyası olan və olmayan iki paralel bazar yaranır ki, bu da sənaye daxilində gərginliyə səbəb
olur".
Bu müzakirələr göstərir
ki, süni intellekt musiqi sahəsində nə tam xilaskar, nə də sənətçinin birbaşa
əvəzçisidir. O, insan
yaradıcılığının əsasında duran ruhu, fərdi təcrübəni və daxili dramaturgiyanı daşıya bilmir, amma düzgün əllərdə güclü
bir alətə çevrilə bilər. Texnologiya musiqinin istehsal formasını dəyişir, lakin onun mahiyyətini hələ ki dəyişdirə
bilmir. Əsl sual süni intellektin nə qədər irəli gedəcəyi deyil, insanın bu inkişaf qarşısında
nəyi qoruyacağıdır.
Canlı ifanın, fərdi üslubun, səmimi emosiyanın dəyəri qorunduqca, musiqi sənət olaraq qalacaq. Əks halda, sürətlə çoxalan
səslər içində
ruhu olan musiqini tapmaq getdikcə çətinləşəcək.
Seçim yenə də insanın öz əlindədir: alqoritmlərin qurduğu səslərimi, yoxsa insan ruhunun yaratdığı
musiqinimi dinləmək?
Zeynəb Mustafazadə
Olaylar.-
2025.- 19-25 dekabr, ¹44.- S.19; 21.