Prisijunkite prie Bilis.lt ir mėgaukitės išskirtinėmis galimybėmis. Registruoti vartotojai mato mažiau reklamų, gali rašyti komentarus bei dalyvauti įvairiuose konkursuose!
Tęsdami prisijungimą soc. tinklais jūs automatiškai sutinkate su privatumo politika ir naudojimosi taisyklėmis, kurias rasite paspaudę čia.
„Alibaba“ siekia neatsilikti: pristatytas „Qwen3-Max“ dirbtinio intelekto modelis su trilijonu parametrų
„Alibaba“ dirbtinio intelekto kūrimo komanda „Qwen“ turėjo produktyvią vasarą, išleisdama daugybę modelių, kurie prilygsta ir netgi pranoksta pirmaujančių JAV laboratorijų, įskaitant „Google“, „OpenAI“ ir „Anthropic“, produktus.
Didžiausias projektas buvo didelis kalbos modelis „Qwen3-Max-Preview“ („Instruct“) su daugiau nei 1 trilijonu parametrų. Parametrai yra vidiniai nustatymai, kurie reguliuoja didelio kalbos modelio elgesį, ir kuo jų daugiau, tuo galingesnis modelis.
Manoma, kad „OpenAI GPT-4o“ turi maždaug tiek pat parametrų, tačiau daugelis pirmaujančių dirbtinio intelekto laboratorijų neseniai pradėjo leisti mažesnius modelius, todėl „Qwen“ autorių sprendimas padidinti šį skaičių vertas dėmesio.
Kinijos kūrėjų paskelbti „Qwen-3-Max-Preview“ etaloniniai rezultatai rodo, kad jis lenkia ankstesnį bendrovės flagmaną – „Qwen3-235B-A22B-2507“ – ir yra rimtas konkurentas kitiems pirmaujantiems modeliams.
„SuperGPQA“, „AIME25“, „LiveCodeBench v6“, „Arena-Hard v2“ ir „LiveBench“ (20241125) testuose naujasis „Qwen3-Max-Preview“ nuolat lenkia „Claude Opus 4“, „Kimi K2“ ir „Deepseek-V3.1“.
Naujasis modelis jau pasiekiamas kūrėjo „Qwen Chat“ svetainėje, per API „Alibaba Cloud“, „OpenRouter“ ir „AnyCoder“ platformose. Skirtingai nuo kitų „Alibaba“ sistemų, naujasis „Qwen3-Max-Preview“ dar nėra prieinamas pagal atvirojo kodo licenciją, ir kol kas kūrėjams teks tenkintis įmonės arba jos partnerių mokama API, kad galėtų jį prijungti prie programų.
Praktiškai modeliui rečiau nepavyksta atlikti sudėtingų užduočių, tokių kaip identiškų skaičių palyginimas ar duotų raidžių skaičiaus skaičiavimas tam tikrame žodyje – ne visi šiuolaikiniai dirbtiniai intelektai tai dar gali. Jis „Qwen Chat“ platformoje taip pat veikia greičiau nei „ChatGPT“ .
„Alibaba Qwen3-Max-Preview“ palaiko 262 144 žetonų kontekstinį langą, maksimalų 258 048 žetonų užklausos dydį ir maksimalų 32 768 atsakymo ilgį. Jis palaiko konteksto kaupimą talpykloje, kuris padeda optimizuoti našumą ilgų sesijų metu.
Modelis skirtas sudėtingam mąstymui (nors mąstymo režimas „Qwen Chat“ dar nepasiekiamas), programos kodo rašymui, struktūrizuotų duomenų formatų, įskaitant JSON, apdorojimui ir kūrybinėms užduotims. Jis vienodai efektyvus tiek pokalbiuose įvairiomis temomis, tiek dirbant agentu; jį gali naudoti verslo klientai ir tyrimų laboratorijos.
Darbo su „Alibaba Qwen3-Max-Preview“ kaina per API „Alibaba Cloud“ priklauso nuo žetonų skaičiaus:
0–32 tūkst. žetonų – 0,861 USD už 1 mln. gaunamų ir 3,441 USD už 1 mln. siunčiamų žetonų;
32 tūkst.–128 tūkst. žetonų – 1,434 USD už 1 mln. gaunamų ir 5,735 USD už 1 mln. siunčiamų žetonų;
128 tūkst.–252 tūkst. žetonų – 2,151 USD už 1 mln. gaunamų ir 8,602 USD už 1 mln. siunčiamų žetonų.
„Alibaba Qwen3-Max-Preview“ anonsas sukėlė audringą reakciją socialiniuose tinkluose. Projekto autoriai pažymėjo, kad jiems pavyko padidinti dirbtinio intelekto modelio mastą iki 1 trilijono parametrų, ir darbas tęsiasi; be to, kitą savaitę jie ketina išleisti dar kai ką.
Kai kurie konteksto ilgio apribojimai yra susiję su pokalbių sąsaja, o ne su pačiu modeliu, pridūrė jie, o jo samprotavimo režimas jau yra „kuriamas“. Pirmieji modelį išbandę vartotojai išreiškė pasitenkinimą rezultatais, gautais atliekant pirminius bandymus; kai kurie domėjosi, kaip jis išspręs problemas, reikalaujančias sudėtingo loginio samprotavimo.
Mašininio mokymosi plėtros vadovo Ahseno Khaliqo prašymu „Alibaba“ „Qwen3-Max-Preview“ modelis „AnyCoder“ platformoje sukūrė vokselio vaizdą – „Minecraft“ stiliaus sodo modelį.
Kiti eksperimentatoriai pastebėjo, kad jis susidorojo su pateiktomis aritmetinėmis problemomis, išsprendė matematinį „dėlionę 24“ ir netgi problemą, su kuria nesusidūrė tokie sunkiasvoriai kaip samprotavimo „OpenAI GPT-5“ ir „Google Gemini 2.5 Pro“.
Pastebėta, kad pateikus sudėtingą užklausą, jis persijungia į samprotavimo režimą, kuriame sukuria struktūrizuotus nuoseklius atsakymus.
Verslo klientams „Qwen3-Max-Preview“ vertė bus nustatoma ne pagal etalonus, o pagal tai, kaip jis praktiškai atlieka konkrečias užduotis. Turėdamas trilijoną parametrų, diegiant programose reikia mažiau nuolatinio tikslinimo, tačiau pakopinė kainodaros sistema gali atgrasyti verslo klientus.
Jo stipriosios pusės yra API panašumas į „OpenAI“ sąsają ir palaikymas talpykloje. Reikėtų pažymėti, kad „Qwen3-Max-Preview“, kaip rodo pavadinimas, vis dar yra preliminari modelio versija, o jo diegimas buvo skubotas.
0 komentarų
Komentuoti ir diskutuoti gali tik registruoti portalo lankytojai. Kviečiame prisijungti prie mūsų bendruomenės ir prisijungti prie diskusijų!
Prašome prisijungti