Google Gemini 3.1 Pro: Endi murakkab muammolarni hal qilishda yanada samaraliroq

Google yana bir sun'iy intellekt modelini taqdim etdi. Google so'nggi paytlarda yangi AI vositalarini jadal rivojlantirmoqda, ayniqsa noyabr oyida Gemini 3 ni chiqarganidan so'ng. Bugun kompaniya o'zining flagman modelini 3.1 versiyasiga yangiladi. Yangi Gemini 3.1 Pro ishlab chiquvchilar va iste'molchilar uchun yaxshiroq muammolarni hal qilish va fikrlash qobiliyatlarini va'da qilgan holda, bugundan boshlab (oldindan ko'rish rejimida) joriy etilmoqda.

Google o'tgan hafta o'zining Deep Think vositasini yaxshilanganini e'lon qildi va ma'lum bo'lishicha, bu yangilanish ortidagi "asosiy intellekt" Gemini 3.1 Pro edi. Har doimgidek, Google'ning so'nggi model e'lonlari ko'plab benchmark ko'rsatkichlari bilan birga keladi, ular asosan sezilarli yaxshilanishlarni ko'rsatadi. Murakkab soha bilimlarini sinovdan o'tkazadigan mashhur Humanity's Last Exam testida Gemini 3.1 Pro rekord darajadagi 44.4 foiz ball to'pladi. Gemini 3 Pro 37.5 foiz, OpenAI'ning GPT 5.2 esa 34.5 foiz ballga erishgan edi.

Google, shuningdek, modelning ARC-AGI-2 dagi yaxshilanishini ta'kidladi, bu test AI ga to'g'ridan-to'g'ri o'rgatib bo'lmaydigan yangi mantiqiy muammolarni o'z ichiga oladi. Gemini 3 ushbu baholashda biroz orqada edi, raqobatchi modellarning 50-60 foizli ballariga qarshi atigi 31.1 foizga erishgan. Gemini 3.1 Pro Google'ning ballini ikki baravardan ko'proq oshirib, 77.1 foizga yetdi.

Google yangi modellarni chiqarganda ko'pincha Arena (ilgari LM Arena) reytingida birinchi o'rinni egallaganini faxr bilan e'lon qilardi, ammo bu safar unday emas. Matn uchun Claude Opus 4.6 yangi Geminidan to'rt ballga oldinroq bo'lib, 1504 ball oldi. Kod uchun esa Opus 4.6, Opus 4.5 va GPT 5.2 High modellari Gemini 3.1 Pro dan biroz ko'proq oldinda. Shuni ta'kidlash kerakki, Arena reytingi foydalanuvchilarning eng yoqqan natijalariga ovoz berishi asosida tuziladi, bu esa to'g'ri ko'ringan, lekin aslida to'g'ri bo'lmagan natijalarni ham mukofotlashi mumkin.

Gemini 3.1 Pro dagi yaxshilanishlarni ko'rsatish uchun Google modelning grafik va simulyatsiyalar yaratish qobiliyatiga e'tibor qaratdi. Taqqoslash videosida ko'rsatilgan SVG misollari ancha nafisroq ko'rinadi. Katta benchmark raqamlari va maxsus tayyorlangan demolar yaxshi, ammo modeldan foydalanganda biron bir farqni sezasizmi? Agar siz mavhum savollarni berib, batafsil, nozik javoblarni kutsangiz, Gemini 3.1 Pro 3.0 ga qaraganda ehtimol yaxshiroq natijalar beradi. Agentlik ish oqimlarini yaratish uchun Geminidan foydalanadigan dasturchilar ham yaxshilanishni ko'rishlari mumkin – Gemini 3.1 Pro APEX-Agents benchmarkida o'z ballini deyarli ikki baravar oshirdi.

Yangilangan model bugundan boshlab AI Studio va Antigravity IDE da oldindan ko'rish rejimida mavjud. Korporativ foydalanuvchilar 3.1 Pro ni Vertex AI va Gemini Enterprise'da ko'rishadi. Oddiy foydalanuvchilar uchun Gemini 3.1 Pro bugundan boshlab Gemini ilovasi va NotebookLM da mavjud. Dasturchilar uchun API narxi (1M token uchun 2$ kirish va 12$ chiqish) va kontekst oynasi (1M kirish va 64k chiqish tokenlari) o'zgarishsiz qoldi. Agar Google'ning odatiy harakati davom etsa, yaqin kelajakda tezroq va arzonroq Flash modeli uchun ham 3.1 yangilanishi chiqishi ehtimoli katta.

So'ngi habarlar

F1: 2026-yilgi mavsum qanday bo'lishini sinovlar ko'rsatdi

Feb. 20, 2026, 12:03 p.m.

Tovuqlardan odamlarga: hayvonlar “buba” tovushini yumaloq deb bilishadi

Feb. 20, 2026, 12:03 p.m.

Diablo II qayta tiklanishi uchun ajoyib bahona: Warlock kelishi bilan oʻyin yanada qiziqarli boʻldi

Feb. 20, 2026, 12:02 p.m.

Rubik kubining yangi talqini: WOWCube murakkablik va imkoniyatlar dunyosi

Feb. 20, 2026, 12:01 p.m.

NASA rahbari Starliner parvozini "A toifali" falokat deb baholadi va agentlik xatolarga yo'l qo'yganini aytdi

Feb. 20, 2026, 12:01 p.m.

ChatGPT talabaga "buyuklik uchun yaratilgani"ni aytdi — keyin psixoz boshlandi.

Feb. 20, 2026, noon

Microsoft 10 000 yillik maʼlumotlarni shishada saqlash usulini yaratdi

Feb. 19, 2026, 10:54 a.m.

Apple'ning so'nggi iOS, macOS va iPadOS beta versiyalaridagi 5 ta asosiy o'zgarish

Feb. 19, 2026, 10:53 a.m.

EPA'ning issiqxona gazlari topilmasini bekor qilishi "minglab o'limlarni" keltirib chiqarishi mumkinligini da'vo qiluvchi sud ishi boshlandi

Feb. 19, 2026, 10:52 a.m.

10 ming dollarga qimmatbaho EV opsiyalari: Chevy Bolt, BMW i3 va boshqalarmi?

Feb. 19, 2026, 10:50 a.m.

O'xshash yangiliklar

ChatGPT talabaga "buyuklik uchun yaratilgani"ni aytdi — keyin psixoz boshlandi.

Feb. 20, 2026

Tovuqlardan odamlarga: hayvonlar “buba” tovushini yumaloq deb bilishadi

Feb. 20, 2026

Sun'iy intellekt yordamida Kaliforniya plyaj shahri velosiped yo'lini to'suvchilarni qidirishni kengaytirdi

Feb. 14, 2026

Ring Flock bilan kelishuvni bekor qildi, reklamadagi distopiya jamoatchilik noroziligiga sabab bo'ldi

Feb. 14, 2026

Yangi GPT-4o AI modeli tezroq va barcha foydalanuvchilar uchun bepul, deb e'lon qiladi OpenAI

May 14, 2024

Meta qoniqarsiz AI bo'limini mustahkamlash uchun Scale AI'ga $15 mlrd sarmoya kiritdi

June 14, 2025