Yadro davri oldi po'latdan AI davri oldi kontentga: G'amlab qo'yishning yangi shakli

Cloudflare kompaniyasining sobiq ijrochi direktori Jon Grem-Kamming yaqinda o‘zining yangi veb-sayti – lowbackgroundsteel.ai’ni ishga tushirganini e’lon qildi. Bu platforma sun’iy intellekt (AI) paydo bo‘lishidan oldin insonlar tomonidan yaratilgan kontentni, go‘yo mashinalar suhbatga qo‘shilishidan avvalgi davrning organik ijodiy ifodasi bo‘lgan vaqt kapsulasi kabi, qimmatbaho resurs sifatida qaraydi. Grem-Kamming o‘tgan hafta o‘z blogida yozganidek, "G‘oya shundaki, AI tomonidan yaratilgan kontent portlashidan oldin paydo bo‘lgan matn, tasvir va videolarning manbalarini ko‘rsatish." Buning sababi esa AI bo‘lmagan mediani noyob insoniyligini saqlab qolishdir.
Arxiv nomi Sovuq urush davridagi ilmiy hodisadan olingan. 1945 yilda yadro quroli sinovlari boshlanganidan so‘ng, atmosfera radiatsiyasi butun dunyo bo‘ylab yangi po‘lat ishlab chiqarishni ifloslantirdi. O‘nlab yillar davomida, sezgir asboblar uchun radiatsiyasiz metallga muhtoj bo‘lgan olimlar urushdan oldingi kema halokatlaridan po‘latni qutqarishga majbur bo‘lishgan. Olimlar bu po‘latni "past fonli po‘lat" deb atashgan. Grem-Kamming hozirgi veb-tarmoq bilan o‘xshashlikni ko‘radi, chunki AI tomonidan yaratilgan kontent tobora inson tomonidan yaratilgan material bilan aralashib, uni "ifloslantirmoqda".
2022 yilda ChatGPT va Stable Diffusion kabi generativ AI modellarining paydo bo‘lishi bilan internetda topilgan medianing inson tomonidan AI vositalarisiz yaratilganligiga ishonch hosil qilish ancha qiyinlashdi. Ayniqsa ChatGPT veb bo‘ylab AI tomonidan yaratilgan matnlar to‘lqinini keltirib chiqardi, bu esa kamida bitta tadqiqot loyihasini butunlay yopishga majbur qildi.
Bu "qurbon" tadqiqotchi Robin Spir tomonidan yaratilgan, 40 dan ortiq tilda so‘z chastotasini kuzatgan wordfreq deb nomlangan Python kutubxonasi edi. U millionlab manbalarni, jumladan, Vikipediyani, filmlar subtitrlarini, yangilik maqolalarini va ijtimoiy mediya platformalarini tahlil qilgan. Bu vosita akademiklar va dasturchilar tomonidan til qanday rivojlanayotganini o‘rganish va tabiiy tilni qayta ishlash ilovalarini yaratishda keng qo‘llanilgan. Loyiha 2024 yil sentyabrida e’lon qildiki, endi yangilanmaydi, chunki "Veb-tarmoq katta til modellaridan yaratilgan loyqa narsalar bilan to‘la, hech kim tomonidan hech narsani ifodalash uchun yozilmagan."
Ba’zi tadqiqotchilar, shuningdek, AI modellarining o‘z chiqishlari asosida o‘qitilishidan xavotirda bo‘lib, bu vaqt o‘tishi bilan sifatning yomonlashishiga olib kelishi mumkin – bu hodisa ba’zan "model kollapsi" deb ataladi. Biroq, so‘nggi dalillar shuni ko‘rsatadiki, bu qo‘rquv ma’lum sharoitlarda haddan tashqari oshirilgan bo‘lishi mumkin. Gerstgrasser va boshqalar (2024) tadqiqotlari shuni ko‘rsatadiki, sintetik ma’lumotlar haqiqiy ma’lumotlar bilan birga to‘plansa, model kollapsidan qochish mumkin, butunlay almashtirilmasa. Aslida, to‘g‘ri nazorat qilingan va haqiqiy ma’lumotlar bilan birlashtirilgan sintetik ma’lumotlar, aslida, yangi, yanada qobiliyatli modellarni o‘qitishga yordam berishi mumkin.
Inson ifodasining vaqt kapsulasi
Grem-Kamming texnologiyalarni saqlash harakatlariga bego‘na emas. U britaniyalik dasturiy ta’minot muhandisi va yozuvchi bo‘lib, asosan POPFile – ochiq kodli elektron pochta spam filtr dasturini yaratgani hamda Buyuk Britaniya hukumatidan kodbuzar Alan Tyuringni ta’qib qilgani uchun uzr so‘rashga muvaffaqiyatli petitsiya yuborgani bilan tanilgan. Bosh vazir Gordon Braun 2009 yilda uzr so‘ragan edi.
Ma’lum bo‘lishicha, uning AI dan oldingi veb-sayti aslida yangi emas, lekin hozirgacha e’lon qilinmagan. "Men uni 2023 yil mart oyida AI tomonidan yaratilgan kontent bilan ifloslanmagan onlayn resurslar uchun yaratganman," deb yozadi u o‘z blogida.
Veb-sayt AI dan oldingi bir qancha yirik kontent arxivlariga ishora qiladi, jumladan: 2022 yil avgustdagi Wikipedia yuklamasi (ChatGPT ning 2022 yil noyabr oyida chiqarilishidan oldin), Project Gutenberg'ning jamoat mulki kitoblar to‘plami, Kongress kutubxonasining fotosurat arxivi va GitHub'ning Arctic Code Vault – 2020 yil fevralida Shimoliy Qutb yaqinidagi sobiq ko‘mir koniga ko‘milgan ochiq kodli kodning surati. Wordfreq loyihasi ham ro‘yxatda mavjud bo‘lib, AI "ifloslanishi" uning metodologiyasini yaroqsiz holga keltirishidan oldingi vaqtga muzlatilgan.
Sayt o‘zining Tumblr sahifasi orqali boshqa AI dan oldingi kontent manbalarining topshiriqlarini qabul qiladi. Grem-Kamming ta’kidlaydiki, loyiha AI davridan oldingi inson ijodkorligini hujjatlashtirishga qaratilgan, AI ga qarshi bayonot berish emas. Atmosfera yadro sinovlari tugagach va fon radiatsiyasi tabiiy darajaga qaytganida, past fonli po‘lat aksariyat maqsadlar uchun keraksiz bo‘lib qoldi. AI dan oldingi kontent ham shunga o‘xshash yo‘nalishda ketadimi, bu savol.
Shunga qaramay, inson ijodkorligi manbalarini, shu jumladan arxivlarni hozirda himoya qilish oqilona tuyuladi, chunki bu omborlar hozirda kamdan-kam qadrlanadigan tarzda foydali bo‘lishi mumkin. Masalan, 2020 yilda men "kriptografik kema" yaratishni taklif qilganman – kelajakdagi tarixchilarning haqiqiyligini tekshirishi mumkin bo‘lgan AI dan oldingi medianing vaqt tamg‘ali arxivi, mening o‘zboshimchalik bilan belgilagan 2022 yil 1 yanvar sanasidan oldin to‘plangan. AI "loyqasi" nafaqat hozirgi nutqni, balki tarixiy yozuvlarni ham xiralashtirishi mumkin.
Hozircha, lowbackgroundsteel.ai kelajakda oxirgi AI oldingi davr deb hisoblanishi mumkin bo‘lgan inson ifodasining kamtarona katalogi bo‘lib turibdi. Bu inson tomonidan yaratilgan va gibrid inson-AI madaniyatlari o‘rtasidagi chegarani belgilaydigan raqamli arxeologiya loyihasi. Inson va mashina chiqishlarini farqlash tobora qiyinlashib borayotgan bir davrda, bu arxivlar AI suhbatga kirishidan oldin insoniy aloqa qanday rivojlanganini tushunish uchun qimmatli bo‘lishi mumkin.