AI ochiq kodni qayta yoza oladi — litsenziyani ham qayta yoza oladimi?

Kompyuter muhandislari va dasturchilar uzoqlardan beri teskari muhandislikka tayanganlar, bu dasturiy ta'minotning funksionalligini uning mualliflik huquqi bilan himoyalangan kodini bevosita nusxalamasdan ko'chirib olish usuli bo'lgan. Endi, sun'iy intellektga asoslangan kodlash vositalari ushbu "toza xona" qayta yozish jarayonining huquqiy, axloqiy va amaliy jihatdan qanday amalga oshirilishi bilan bog'liq yangi muammolarni keltirib chiqarmoqda.

Bu muammolar o'tgan hafta chardet'ning yangi versiyasi chiqarilishi bilan yuzaga keldi. chardet – bu belgilar kodirovkasini avtomatik aniqlash uchun mashhur ochiq kodli Python kutubxonasidir. Repozitoriy dastlab 2006-yilda dasturchi Mark Pilgrim tomonidan yozilgan va LGPL litsenziyasi ostida chiqarilgan bo'lib, u koddan foydalanish va uni qayta tarqatishga qattiq cheklovlar qo'ygan edi.

Dan Blanchard 2012-yilda repozitoriyga xizmat ko'rsatishni o'z zimmasiga oldi, ammo o'tgan hafta chardet'ning 7.0-versiyasini chiqarish bilan ba'zi bahs-munozaralarga sabab bo'ldi. Blanchard ushbu qayta ishlashni Claude Code yordamida "noldan boshlab, MIT litsenziyasi ostida qayta yozilgan" butun kutubxona deb ta'rifladi, bu esa avvalgisidan "ancha tezroq va aniqroq" bo'lishi kerak edi.

The Register nashriga bergan intervyusida Blanchard, u uzoq vaqtdan beri chardet'ni Python standart kutubxonasiga qo'shishni istaganini, ammo bu maqsadga erishishga xalaqit berayotgan "uning litsenziyasi, tezligi va aniqligi" bilan bog'liq muammolarni tuzatishga vaqti yo'qligini aytdi. Claude Code yordamida, Blanchard kutubxonani "taxminan besh kun ichida" qayta ishlashga muvaffaq bo'lganini va 48 barobar tezlikni oshirishga erishganini ma'lum qildi.

Biroq, bu natijadan hamma ham mamnun emas. Mark Pilgrim nomi bilan foydalanuvchi GitHub'da paydo bo'lib, ushbu yangi versiya Pilgrim'ning asl kodini ruxsat beruvchi MIT litsenziyasi ostida noqonuniy qayta litsenziyalashga teng ekanligini ta'kidladi (bu, boshqa narsalar qatori, uni yopiq kodli loyihalarda ishlatishga ruxsat beradi). O'zining asl LGPL litsenziyasi ostidagi kodining o'zgartirilishi sifatida, Pilgrim ushbu yangi chardet versiyasi ham xuddi shu LGPL litsenziyasini saqlab qolishi kerakligini ta'kidlaydi.

"Ularning 'to'liq qayta yozilgan' degan da'vosi ahamiyatsiz, chunki ular asl litsenziyali kodga yetarlicha ta'sir qilishgan (ya'ni, bu 'toza xona' amalga oshirish emas)", deb yozadi Pilgrim. "Fantastik kod generatorini aralashtirish ularga hech qanday qo'shimcha huquqlar bermaydi. Men ushbu loyihani asl litsenziyasiga qaytarishni hurmat bilan talab qilaman."

Uning kodi kimniki, umuman olganda?

Pilgrimga bergan javobida Blanchard, u "asl kod bazasiga keng ta'sir ko'rsatganini" tan oldi, ya'ni uning "toza xona" teskari muhandisligi uchun odatda qo'llaniladigan "qattiq ajratish" usuli mavjud emas edi. Biroq, Blanchardning ta'kidlashicha, bu an'ana inson dasturchilari uchun "natijada olingan kod asl nusxaning hosila asari emasligini ta'minlash" maqsadida yaratilgan edi.

Bu holatda, Blanchardning aytishicha, sun'iy intellekt tomonidan yaratilgan yangi kod avvalgisidan "sifat jihatidan farq qiladi" va "strukturaviy jihatdan eski koddan mustaqil". Dalil sifatida u JPlag o'xshashlik statistikalarini keltirib o'tdi, ular chardet 7.0.0 versiyasining har qanday faylining maksimal 1,29 foizi 6.0.0 versiyasining tegishli fayliga strukturaviy jihatdan o'xshashligini ko'rsatadi. Boshqa tomondan, 5.2.0 versiyasini 6.0.0 versiyasi bilan taqqoslash ba'zi tegishli fayllarda 80 foizgacha o'xshashlikni ko'rsatadi.

"7.0.0 kod bazasidagi hech bir fayl oldingi versiyalardagi hech qanday faylga strukturaviy jihatdan o'xshamaydi", deb yozadi Blanchard. "Bu 'ko'p qismi qayta yozilgan, ammo ba'zi fayllar saqlanib qolgan' holat emas. Hech narsa saqlanib qolmadi."

Blanchard says starting with a “wipe it clean” commit and a fresh repository was key in crafting fresh, non-derivative code from the AI.

Blanchardning aytishicha, u ushbu "AI toza xonasi" jarayonini avval dizayn hujjatida arxitekturani belgilash va Claude Code'ga ba'zi talablarni yozish orqali amalga oshirgan. Shundan so'ng, Blanchard "bo'sh repozitoriyada, eski manba daraxtiga kirishsiz boshladi va Claude'ga LGPL/GPL litsenziyalangan kodga hech narsani asoslamaslikni aniq ko'rsatdi."

Biroq, bu oddiy hikoyani murakkablashtiradigan bir nechta omillar mavjud. Birinchidan, Claude chardet'ning avvalgi versiyalaridan ba'zi metadata fayllariga aniq tayangan, bu esa ushbu versiyaning aslida "hosila" ekanligi haqida bevosita savollarni tug'diradi.

Ikkinchidan, Claude modellari ommaviy Internetdan olingan ulkan ma'lumotlar to'plami asosida o'qitilgan, ya'ni Claude o'z o'qitishida chardet'ning avvalgi versiyalarining ochiq kodini iste'mol qilgan bo'lishi ehtimoli juda yuqori. Garchi yangi kod strukturaviy jihatdan eskidan farq qilsa ham, bu avvalgi "bilim" Claude'ning ijodini Pilgrim ishining "hosila"siga aylantiradimi-yo'qmi, ochiq savoldir.

Va nihoyat, inson omili qoladi. Garchi ushbu yangi versiyaning kodi Claude tomonidan yaratilgan bo'lsa-da, Blanchardning aytishicha, u "Claude yordamida natijaning har bir qismini ko'rib chiqqan, sinovdan o'tkazgan va takrorlagan. ... Men kodni qo'lda yozmadim, lekin uni loyihalash, ko'rib chiqish va har bir jihatini takrorlashda chuqur ishtirok etdim." Chardet'ning avvalgi kodini yaxshi biladigan kishi yangi kodni ko'rib chiqishda shu qadar faol ishtirok etishi, ushbu versiyani butunlay yangi loyiha deb hisoblash mumkinmi, degan savolga ham ta'sir qilishi mumkin.

Jasur yangi dunyo

Barcha bu masalalar tabiiyki, ochiq kodli hamjamiyatda chardet 7.0.0 versiyasining qonuniyligi bo'yicha katta munozaralarga olib keldi. "Kodni qayta amalga oshirish so'ralgan Katta Til Modelida 'toza' hech narsa yo'q", dedi Erkin Dasturiy Ta'minot Jamg'armasi ijrochi direktori Zoë Kooyman The Register nashriga.

Biroq, boshqalar kod litsenziyalari bilan bog'liq bahslarda tez-tez yuzaga keladigan "Tesey kemasi" uslubidagi dalillar bu yerda unchalik qo'llanilmaydi deb hisoblaydilar. "Agar siz barcha kodni tashlab, noldan boshlasangiz, hatto oxirgi natija bir xil ishlasa ham, bu yangi kema", dedi ochiq kodli dasturchi Armin Ronacher vaziyatni tahlil qilgan blog postida.

The legal status of AI-generated code is still largely unsettled.

Eski kod litsenziyalaridan tashqari, sun'iy intellektni butunlay yangi kod yaratishda ishlatish kelajakda o'zining huquqiy muammolarini ham keltirib chiqarishi mumkin. Sudlar allaqachon sun'iy intellekt patentga muallif bo'la olmasligi yoki san'at asarining mualliflik huquqi egasi bo'la olmasligi haqida qaror chiqarganlar, ammo sun'iy intellekt tomonidan to'liq yoki qisman yaratilgan dasturiy ta'minotni litsenziyalash bo'yicha hali qaror qabul qilinmagan. Bunday generatsiya qilingan kod bilan ochiq kodli litsenziyaning potentsial "buzilishi" bilan bog'liq masalalar nihoyatda tez murakkablashishi mumkin.

Bu yerda natija qanday bo'lmasin, sun'iy intellektni ko'plab ochiq kodli loyihalarni tezda qayta yozish va qayta litsenziyalash uchun, inson dasturchilarining uncha katta urinishlarisiz ishlatishning amaliy ta'siri butun hamjamiyatga katta zanjirsimon ta'sir ko'rsatishi ehtimoldan yiroq emas.

"Endi qayta yozish jarayoni juda oson bo'ldi va ko'pchilik bundan bezovta bo'lmoqda", deb yozadi italiyalik dasturchi Salvatore "antirez" Sanfilippo o'z blogida. "Bu yerda yanada fundamental haqiqat bor: dasturiy ta'minotning tabiati o'zgardi; turli litsenziyalar ostida qayta amalga oshirishlar bunday tabiatning abadiy qanday o'zgarganligining bir namunasi. Avtomatik dasturlashning har bir ko'rinishi bilan kurashish o'rniga, men yangi mental model yaratish va moslashish yaxshiroq deb hisoblayman."

Boshqalar esa bu tub o'zgarishni yanada xavotirliroq tarzda ta'rifladilar. "Men oynani sindirib, yong'in signalini yoqyapman!" Ochiq kodli targ'ibotchi Bruce Perens The Register nashriga aytdi. "Dasturiy ta'minotni ishlab chiqishning butun iqtisodiyoti o'ldi, yo'q bo'ldi, tugadi! ... Biz buni avval ham ko'rganmiz, masalan, matbaa dastgohi paydo bo'lganda va mualliflik huquqi qonunini keltirib chiqarganda, ilmiy metod keng tarqalganda va birdaniga bilimlarni to'plash uchun mantiqiy tuzilma paydo bo'lganda. Menimcha, bu ham xuddi shunday kattalikdagi o'zgarishdir."