Google Gemini 3.1 Pro: Endi murakkab muammolarni hal qilishda yanada samaraliroq
Google yana bir sun'iy intellekt modelini taqdim etdi. Google so'nggi paytlarda yangi AI vositalarini jadal rivojlantirmoqda, ayniqsa noyabr oyida Gemini 3 ni chiqarganidan so'ng. Bugun kompaniya o'zining flagman modelini 3.1 versiyasiga yangiladi. Yangi Gemini 3.1 Pro ishlab chiquvchilar va iste'molchilar uchun yaxshiroq muammolarni hal qilish va fikrlash qobiliyatlarini va'da qilgan holda, bugundan boshlab (oldindan ko'rish rejimida) joriy etilmoqda.
Google o'tgan hafta o'zining Deep Think vositasini yaxshilanganini e'lon qildi va ma'lum bo'lishicha, bu yangilanish ortidagi "asosiy intellekt" Gemini 3.1 Pro edi. Har doimgidek, Google'ning so'nggi model e'lonlari ko'plab benchmark ko'rsatkichlari bilan birga keladi, ular asosan sezilarli yaxshilanishlarni ko'rsatadi. Murakkab soha bilimlarini sinovdan o'tkazadigan mashhur Humanity's Last Exam testida Gemini 3.1 Pro rekord darajadagi 44.4 foiz ball to'pladi. Gemini 3 Pro 37.5 foiz, OpenAI'ning GPT 5.2 esa 34.5 foiz ballga erishgan edi.
Google, shuningdek, modelning ARC-AGI-2 dagi yaxshilanishini ta'kidladi, bu test AI ga to'g'ridan-to'g'ri o'rgatib bo'lmaydigan yangi mantiqiy muammolarni o'z ichiga oladi. Gemini 3 ushbu baholashda biroz orqada edi, raqobatchi modellarning 50-60 foizli ballariga qarshi atigi 31.1 foizga erishgan. Gemini 3.1 Pro Google'ning ballini ikki baravardan ko'proq oshirib, 77.1 foizga yetdi.
Google yangi modellarni chiqarganda ko'pincha Arena (ilgari LM Arena) reytingida birinchi o'rinni egallaganini faxr bilan e'lon qilardi, ammo bu safar unday emas. Matn uchun Claude Opus 4.6 yangi Geminidan to'rt ballga oldinroq bo'lib, 1504 ball oldi. Kod uchun esa Opus 4.6, Opus 4.5 va GPT 5.2 High modellari Gemini 3.1 Pro dan biroz ko'proq oldinda. Shuni ta'kidlash kerakki, Arena reytingi foydalanuvchilarning eng yoqqan natijalariga ovoz berishi asosida tuziladi, bu esa to'g'ri ko'ringan, lekin aslida to'g'ri bo'lmagan natijalarni ham mukofotlashi mumkin.
Gemini 3.1 Pro dagi yaxshilanishlarni ko'rsatish uchun Google modelning grafik va simulyatsiyalar yaratish qobiliyatiga e'tibor qaratdi. Taqqoslash videosida ko'rsatilgan SVG misollari ancha nafisroq ko'rinadi. Katta benchmark raqamlari va maxsus tayyorlangan demolar yaxshi, ammo modeldan foydalanganda biron bir farqni sezasizmi? Agar siz mavhum savollarni berib, batafsil, nozik javoblarni kutsangiz, Gemini 3.1 Pro 3.0 ga qaraganda ehtimol yaxshiroq natijalar beradi. Agentlik ish oqimlarini yaratish uchun Geminidan foydalanadigan dasturchilar ham yaxshilanishni ko'rishlari mumkin – Gemini 3.1 Pro APEX-Agents benchmarkida o'z ballini deyarli ikki baravar oshirdi.
Yangilangan model bugundan boshlab AI Studio va Antigravity IDE da oldindan ko'rish rejimida mavjud. Korporativ foydalanuvchilar 3.1 Pro ni Vertex AI va Gemini Enterprise'da ko'rishadi. Oddiy foydalanuvchilar uchun Gemini 3.1 Pro bugundan boshlab Gemini ilovasi va NotebookLM da mavjud. Dasturchilar uchun API narxi (1M token uchun 2$ kirish va 12$ chiqish) va kontekst oynasi (1M kirish va 64k chiqish tokenlari) o'zgarishsiz qoldi. Agar Google'ning odatiy harakati davom etsa, yaqin kelajakda tezroq va arzonroq Flash modeli uchun ham 3.1 yangilanishi chiqishi ehtimoli katta.