Microsoft 10 000 yillik maʼlumotlarni shishada saqlash usulini yaratdi

Ma'lumotlarni arxivlash ko'plab qiyinchiliklarni keltirib chiqaradi. Bizga yuzlab yillar davomida nihoyatda zich va barqaror bo'lgan, ideal holda, foydalanilmayotgan vaqtda energiya sarflamaydigan saqlash vositasi kerak. Bu borada juda ko'p g'oyalar ilgari surilgan – hatto DNK ham ko'rib chiqilgan – ammo eng sodda usullardan biri ma'lumotlarni shishaga o'yib yozishdir. Shishaning ko'p turlari jismoniy va kimyoviy jihatdan juda barqaror bo'lib, unga narsalarni o'yib yozish nisbatan oson.

Shishaga asoslangan saqlash tizimining turli jihatlarini namoyish etuvchi ko'plab dastlabki ishlar olib borilgan. Ammo chorshanba kuni "Nature" jurnalida Microsoft Research "Project Silica" loyihasini e'lon qildi. Bu loyiha kub millimetrga bir gigabitdan ortiq zichlikda kichik shisha plitalarga ma'lumotlarni yozish va o'qish imkoniyatiga ega bo'lgan tizimning ishchi namoyishini taqdim etdi.

Shishaga yozish usuli

Biz shishani mo'rt, sinuvchan va asrlar davomida asta-sekin pastga oqishi mumkin deb o'ylashga odatlanganmiz, garchi oxirgi da'vo shunchaki afsona bo'lsa ham. Shisha – bu materiallar toifasi bo'lib, turli kimyoviy moddalar shisha hosil qilishi mumkin. To'g'ri boshlang'ich kimyoviy modda bilan, tadqiqotchilar ta'kidlaganidek, "termik va kimyoviy jihatdan barqaror, namlik kirishiga, harorat o'zgarishlariga va elektromagnit shovqinlarga chidamli" shisha yasash mumkin. Garchi shikastlanishni minimallashtirish uchun u bilan ehtiyotkorlik bilan munosabatda bo'lish kerak bo'lsa-da, shisha uzoq muddatli saqlash uchun biz istagan barqarorlikni ta'minlaydi.

Ma'lumotlarni shishaga kiritish uni o'yib yozish kabi oddiy jarayon. Ammo aynan shu narsa qiyinchiliklardan biri bo'lib kelgan, chunki o'yib yozish odatda sekin jarayon hisoblanadi. Biroq, femtosekundli lazerlarning (10⁻¹⁵ soniya davom etadigan impulslarni chiqaradigan va sekundiga millionlab impuls bera oladigan lazerlar) rivojlanishi yozish vaqtini sezilarli darajada qisqartirishi va o'yib yozishni juda kichik maydonga qaratishga imkon beradi, bu esa potentsial ma'lumotlar zichligini oshiradi.

Ma'lumotlarni qayta o'qish uchun bir nechta variant mavjud. Biz optik disklardan ma'lumotlarni o'qish uchun lazerlardan foydalanib allaqachon katta muvaffaqiyatlarga erishganmiz, garchi sekin bo'lsa ham. Ammo shishaga o'yilgan kichik xususiyatlarni qabul qila oladigan har qanday narsa ishlashi mumkin.

Yuqoridagi mulohazalarni hisobga olgan holda, "Project Silica" uchun nazariy darajada hamma narsa tayyor edi. Asosiy savol ularni qanday qilib ishlaydigan tizimga birlashtirish edi. Microsoft ehtiyotkorlik uchun bu savolga ikki marta javob berishga qaror qildi.

Amaliy tizim

Bu ikki javob o'rtasidagi farq ma'lumotlarning alohida birligi (voksel deb ataladi) shishaga qanday yozilishiga bog'liq. Ular sinab ko'rgan voksel turlaridan biri ikki tomonlama sinish (birefringence)ga asoslangan edi, bunda fotonlarning sinishi ularning polyarizatsiyasiga bog'liq. Polyarizatsiyalangan lazer nuri yordamida vokselni shishaga o'yib, ikki tomonlama sinish hosil qilish mumkin, bu esa difraksiya chegarasidan kichikroq xususiyatlarni yaratadi. Amalda, bu oval shaklidagi bo'shliqni yaratish uchun bitta lazer impulsidan foydalanishni, so'ngra ikki tomonlama sinishni keltirib chiqarish uchun ikkinchi, polyarizatsiyalangan impulsni talab qiladi. Vokselning o'ziga xosligi ovalning yo'nalishiga asoslangan; biz bir nechta yo'nalishlarni ajrata olganimiz sababli, har bir vokselda bir bitdan ko'proq ma'lumot saqlash mumkin.

Muqobil yondashuv lazer impulsidagi energiya miqdorini o'zgartirish orqali sinish effektlarining kattaligini o'zgartirishni o'z ichiga oladi. Bunda ham vokseldagi ikkitadan ortiq holatni ajrata olish mumkin, bu esa har bir vokselda bir nechta ma'lumot bitlarini saqlash imkonini beradi.

The map data from Microsoft Flight Simulator etched onto the Silica storage medium.
Microsoft Flight Simulator xaritasining ma'lumotlari Silica saqlash vositasiga o'yilgan. Manba: Microsoft Research

Silica tizimida ularni o'qish sinish ko'rsatkichidagi farqlarni aniqlay oladigan mikroskop yordamida amalga oshiriladi (mikroskopiya ishqibozlari uchun bu "faza kontrastli mikroskopiya" usuli qo'llanilganini anglatadi). Mikroskopiya bitta shisha bo'lagiga qancha voksel qatlami joylashtirilishi mumkinligini cheklaydi. O'yib yozish paytida qatlamlar yetarli masofada ajratiladi, shunda bir vaqtning o'zida mikroskopning fokus tekisligida faqat bitta qatlam bo'ladi. O'yib yozish jarayoni shuningdek, avtomatlashtirilgan mikroskop tizimiga linzani shisha ustidagi ma'lum nuqtalarga joylashtirishga imkon beruvchi belgilarni ham o'z ichiga oladi. Shundan so'ng, tizim fokus tekisligini asta-sekin o'zgartirib, qatlamlar bo'ylab harakatlanadi va vokselning turli qatlamlarini o'z ichiga olgan tasvirlarni oladi.

Ushbu mikroskop tasvirlarini sharhlash uchun Microsoft konvolyutsion neyron tarmog'idan foydalangan bo'lib, u vokselning ma'lum bir qatlami uchun fokus tekisligida va unga yaqin joylashgan tasvirlardagi ma'lumotlarni birlashtiradi. Bu samarali usul, chunki yaqin atrofdagi vokselning ta'siri ma'lum bir vokselning ko'rinishini nozik tarzda o'zgartiradi va AI tizimi yetarli o'qitish ma'lumotlari berilsa, buni aniqlay oladi.

Jumboqning oxirgi qismi – ma'lumotlarni kodlash. Silica tizimi saqlayotgan ma'lumotlarning xom bitlar oqimini oladi va past zichlikli paritet tekshiruvi (low-density parity-check, LDPC) kodi (5G tarmoqlarida qo'llaniladigan xato tuzatish usuli) yordamida xato tuzatishni qo'shadi. Keyin qo'shni bitlar vokselning bir bitdan ko'proq ma'lumotni saqlash qobiliyatidan foydalanadigan simvollarni yaratish uchun birlashtiriladi. Simvollar oqimi yaratilgach, u shishaga yozishga tayyor bo'ladi.

Ishlash ko'rsatkichlari

Yozish tizimda hanuzgacha to'siq bo'lib qolmoqda, shuning uchun Microsoft to'rt lazer yordamida bir vaqtning o'zida bitta shisha plitaga haddan tashqari qizib ketmasdan yozish imkonini beradigan uskuna ishlab chiqdi. Bu sekundiga 66 megabit tezlikda yozish imkonini beradi va jamoa yana o'nlab qo'shimcha lazerlarni qo'shish mumkin deb hisoblaydi. Bu kerak bo'lishi mumkin, chunki bitta shisha plitasida (plitaning o'lchamlari 12 sm x 12 sm va qalinligi 0,2 sm) 4,84 TB gacha ma'lumot saqlash mumkin. Bu bitta plitani to'liq yozish uchun 150 soatdan ortiq vaqt talab etilishini anglatadi.

Saqlash tizimining "gacha" jihati ma'lumotlarni yozishning ikki xil usuli bilan erishish mumkin bo'lgan ma'lumotlar zichligiga bog'liq. Ikki tomonlama sinishga asoslangan usul ko'proq optik uskunani talab qiladi va faqat yuqori sifatli shishalarda ishlaydi, ammo bir xil hajmga ko'proq voksel siqib joylashtira oladi, shuning uchun sezilarli darajada yuqori ma'lumotlar zichligiga ega. Muqobil yondashuv bir xil shisha plitaga ikki terabaytdan biroz ko'proq ma'lumot joylashtira oladi, ammo oddiyroq uskuna bilan amalga oshirilishi mumkin va har qanday turdagi shaffof materialda ishlashi mumkin.

Borosilikat shisha nihoyatda yuqori barqarorlikni ta'minlaydi; Microsoftning tezlashtirilgan qarish tajribalari shuni ko'rsatadiki, ma'lumotlar xona haroratida 10 000 yildan ortiq vaqt davomida barqaror bo'ladi. Bu Microsoftga "Bizning natijalarimiz shuni ko'rsatadiki, Silica raqamli asr uchun arxiv saqlash yechimi bo'lishi mumkin" deb e'lon qilishga undadi.

Biroq, bu biroz mubolag'a bo'lishi mumkin. Masalan, Square Kilometer Array teleskopi har yili 700 petabayt ma'lumotni arxivlashi kutilmoqda. Bu shuni anglatadiki, ushbu bitta teleskopdan olingan ma'lumotlarni saqlash uchun har yili 140 000 dan ortiq shisha plitasi kerak bo'ladi. Yozish tezligini sezilarli darajada ko'proq lazerlar qo'shish orqali oshirish mumkinligini hisobga olsak ham, bu ko'rsatkichlarga yetishish uchun 600 dan ortiq Silica mashinasi parallel ravishda ishlashi kerak bo'ladi. Va Square Kilometer Array katta hajmdagi ma'lumotlarni yaratadigan yagona loyiha emas.

Shunga qaramay, Silica'ni bunday turdagi vazifalar uchun juda mos keladigan ba'zi xususiyatlari bor, xususan, ma'lumotlarni saqlash uchun mutlaqo energiya talab qilinmasligi va kerak bo'lganda uni tezda olish mumkinligi (masalan, DNKdan ma'lumot olish uchun bir necha kun kerak bo'lishiga keskin qarama-qarshi). Bundan tashqari, men tan olishim kerakki, men ilmiy fantastikadan chiqqan narsaga o'xshash saqlash vositasiga ega tizimga qiziqaman.

Nature, 2026. DOI: 10.1038/s41586-025-10042-w.