Nevroloqlar insan beyninin gözümüzün gördüklərini əqli şəkillərə necə çevirdiyini demistifikasiya etmək üçün mübarizə aparır, süni intellekt (Aİ) bu fiquru təqlid etməkdə daha da yaxşılaşır. Bu yaxınlarda qarşıdan gələn kompüter görmə konfransında təqdim edilməsi planlaşdırılan araşdırma göstərir ki, Aİ beyin skanlarını oxuya və insanın gördüyü şəkillərin əsas real versiyalarını yenidən yarada bilər. Tədqiqatçıların fikrincə, bu texnologiyanın çoxsaylı tətbiqləri ola bilər: müxtəlif heyvan növlərinin dünyanı necə dərk etməsi tədqiq etməkdən tutmuş, bəlkə də bir gün insan xəyallarını qələmə almaqdan və iflic olan insanlarda ünsiyyətə kömək etməkdən tutmuş.
Bir çox laboratoriyalar AI-dən istifadə edərək beyin skanlarını oxuyub, mövzunun bu yaxınlarda gördüyü şəkilləri yenidən yaradıblar. Məsələn, insan üzləri və mənzərələrin şəkilləri. Yeni araşdırma ilk dəfədir ki, alman qrupu tərəfindən hazırlanan və 2022-ci ildə açıq şəkildə buraxılan ''Stable Diffusion'' adlı Aİ alqoritminin bu iş üçün istifadə edildiyini qeyd edir. Sabit Diffuziya DALL-E2 və Midjourney kimi digər mətn-to-image "generative" AI-lərə bənzəyir. Mətn təsvirləri ilə əlaqəli milyardlarla şəkil üzərində təlim aldıqdan sonra mətndən yeni şəkillər istehsal edir.
Yeni araşdırma üçün Yaponiyada bir qrup standart Stabil Diffuziya sisteminə əlavə təlimlər əlavə edərək, minlərlə foto haqqında əlavə mətn təsvirlərini beyin skan araşdırmalarının iştirakçıları tərəfindən müşahidə edildikdə, beyin şəkilləri ilə əlaqələndirdi.
Beyin skanlarını deşifrə etmək üçün Aİ alqoritmlərindən istifadə edən əvvəlki cəhdlərdən fərqli olaraq, stabil Diffuziya alqoritmə fotoaplikapları daxil etməklə hər bir iştirakçı üçün daha az təlimdən daha çox şey əldə edə bildi. Prinston Universitetinin koqnitiv neyroscientlərindən olan və bu işlə məşğul olmayan Ariel Qoldşteynin sözlərinə görə, bu, mətnli və vizual informasiyanı "beyni deşifrə etmək" üçün özündə cəmləşdirən roman üsuludur.
Osaka Universitetinin eksperimenti ilə məşğul olan sistem neyroşəbəkəsi Yu Takaqinin sözlərinə görə, Aİ alqoritmi beynin görüntü qavrayışı ilə məşğul olan müxtəlif bölgələrindən toplanan məlumatlardan istifadə edir. Məsələn, occipital və temporal loblar. Sistem funksional maqnit rezonans görüntüləmə (fMRI) beyin skanlarından məlumatları interpretasiya edirdi. Bu skanların köməyi ilə beyinin aktiv bölgələrinə qan axınının dəyişməsi aşkar edilir. İnsanlar şəkilə baxdıqda temporal loblar əsasən şəklin (insanların, obyektlərin və ya mənzərənin) məzmunu haqqında məlumatları qeydə alarlar. Halbuki, oksipital lobda əsasən düzülüşün və perspektivin, məsələn, məzmunun miqyası və mövqeyi haqqında məlumatlar qeydə alınır. Bütün bu məlumatlar fMRI tərəfindən beyin fəaliyyətində zirvələri ələ keçirtdikcə qeydə alınır. Bundan sonra bu təsvirləri Aİ-dən istifadə edərək təqlid şəklinə yenidən çevirmək olar.
Yeni araşdırmada tədqiqatçılar Minnesota Universitetinin təqdim etdiyi onlayn məlumat dəstindən istifadə edərək Stabil Diffuziya alqoritminə əlavə təlimlər əlavə ediblər. Bu təlim dörd iştirakçının beyin skanlarından ibarət olub. Onların hər biri 10 min fotoşəkildən ibarət bir setə baxıblar. Eyni dörd iştirakçıdan olan bu beyin skanlarının bir hissəsi təlimlərdə istifadə edilmədi və daha sonra Aİ sistemini yoxlamaq üçün istifadə edildi.
Aİ-nin yaratdığı hər bir görüntü səs-küy kimi başlayır, televiziya statikini xatırladır və səs-küyü fərqləndirici xüsusiyyətlərlə əvəz edir. Belə ki, Sabit Diffuziya alqoritmi insanın beyin fəaliyyəti tərzlərini təlim məlumat dəstində olan şəkillərlə şəkilə baxmaqdan müqayisə edir. Sistem effektiv şəkildə baxılan fotonun məzmunu, tərtibatı və perspektivini təsvir edən şəkil yaradır. Takagi deyir ki, yeni sistem əvvəlkilərdən daha effektiv idi, daha az cərimə-tuning tələb olunurdu və daha kiçik məlumat dəsti ilə təlim keçmək olardı.
Tədqiqatçıların fikrincə, beyin fəaliyyəti, əsasən, oksipital lobda, baxılan şəkillərin düzülüşünü və perspektivini yenidən yaratmaq üçün kifayət qədər məlumat verdi. Lakin alqoritm real fotodan saat qülləsi kimi obyektləri yenidən mənimsəmək üçün mübarizə aparmış və bunun əvəzində mücərrəd rəqəmlər yaratmışdır. Yapon komandasının sözlərinə görə, bu problemin aradan qaldırılması üsullarından biri alqoritmi daha ətraflı proqnozlaşdırmaq üçün təlim edə biləcək daha böyük təlim məlumat setlərindən istifadə etmək olardı. Lakin fMRI məlumat dəsti bunun üçün həddindən artıq məhdud idi.
Bunun əvəzinə, tədqiqatçılar Minnesota fMRİ məlumat dəstində şəkilləri müşayiət edən şəkil yazılarından açar sözlər istifadə edərək bu məsələni sünnü etdilər. Məsələn, təlim fotolarından birində saat qülləsi olsaydı, skandan beyin fəaliyyətinin sxemi həmin obyektlə əlaqəli olardı. Bu isə o demək idi ki, əgər test mərhələsində eyni beyin şəkli bir dəfə də tədqiqat iştirakçısı tərəfindən sərgilənsə, sistem obyektin açar sözünü Sabit Diffuziyanın normal mətn-to-image generatoruna qidalandıracaq və saat qülləsi yenidən yaradılmış şəklə daxil ediləcək, beyin şəkli ilə göstərilən düzülüşü və perspektivi izləmiş olacaq və nəticədə real fotonun inandırıcı təqlidi baş verəcək.