Lenkų kalba aplenkė net ir anglų: dirbtinis intelektas geriausiai supranta ne tą kalbą, kurios tikėjotės

Paskelbė Lina Snarskienė
Paskelbta

Lenkų kalba aplenkė net ir anglų: dirbtinis intelektas geriausiai supranta ne tą kalbą, kurios tikėjotės

Ilgą laiką buvo manoma, kad dirbtiniam intelektui lengviausia dirbti su anglų kalba. Ji laikyta pagrindine technologijų, mokslo ir skaitmeninės komunikacijos kalba. Tačiau naujas tyrimas šį įsitikinimą sudrebino iš pagrindų.

JAV Merilendo universiteto kartu su technologijų bendrove „Microsoft“ atliktas tyrimas parodė netikėtą rezultatą. Pasirodo, dirbtinis intelektas geriausiai supranta ne anglų, o lenkų kalba pateikiamas užduotis ir ilgus tekstus. Anglų kalba šiame reitinge liko tik šeštoje vietoje.

Tyrimo autoriai pabrėžia, kad tokios išvados buvo netikėtos net patiems mokslininkams. Iki šiol manyta, jog kuo kalba labiau paplitusi, tuo geriau ją „perpranta“ dirbtinio intelekto modeliai.

Kaip buvo atliekamas tyrimas

Tyrėjų komanda analizavo, kaip skirtingi didieji kalbiniai modeliai susidoroja su identiškomis užduotimis skirtingomis kalbomis. Buvo vertinami tokie modeliai kaip „OpenAI“, „Google Gemini“, „Qwen“, „Llama“ ir „DeepSeek“.

Visiems modeliams buvo pateikiamos tos pačios užduotys 26 skirtingomis kalbomis. Vertintas ne tik atsakymų tikslumas, bet ir gebėjimas suprasti ilgesnius, sudėtingesnius tekstus. Būtent ši dalis atskleidė ryškiausius skirtumus tarp kalbų.

Pasak ataskaitos autorių, eksperimentas parodė, kad anglų kalba ne visais atvejais yra pati patogiausia dirbtiniam intelektui. Kai kuriuose modeliuose ji net nepriartėjo prie pirmųjų pozicijų.

Kodėl lenkų kalba pasirodė geriausiai

Didžiausią nuostabą sukėlė lenkų kalbos rezultatai. Atliekant užduotis šia kalba, dirbtinio intelekto vidutinis tikslumas siekė 88 proc. Tai buvo aukščiausias rezultatas tarp visų testuotų kalbų.

Tyrėjai pastebi, kad lenkų kalba ypač gerai pasirodė analizuojant ilgus tekstus. Modeliai tiksliau suprato kontekstą, rečiau klydo interpretuodami sakinių reikšmes ir geriau išlaikė loginį nuoseklumą.

Įdomu tai, kad lenkų kalba tradiciškai laikoma viena sudėtingesnių žmonėms. Sudėtinga gramatika, linksnių sistema ir lanksti sakinių struktūra dažnai kelia sunkumų užsieniečiams. Tačiau dirbtiniam intelektui tai, regis, tapo privalumu, o ne kliūtimi.

Ką apie tai sako patys lenkai

Lenkijos patentų biuras viešai sureagavo į tyrimo rezultatus. Socialiniame tinkle „Facebook“ paskelbtame įraše pabrėžta, kad iki šiol lenkų kalba buvo laikoma itin sudėtinga, tačiau dirbtinis intelektas su ja susidorojo puikiai.

Pasak jų, tai rodo, jog kalbos sudėtingumas žmonėms nebūtinai reiškia sudėtingumą algoritmams. Kai kuriais atvejais struktūruota ir gramatikos taisyklėmis griežčiau apibrėžta kalba netgi padeda dirbtiniam intelektui tiksliau apdoroti informaciją.

Tai taip pat atkreipė dėmesį į tai, kad technologijų pažanga gali pakeisti nusistovėjusias nuostatas apie lengvas ir sunkias kalbas.

Kodėl anglų kalba liko tik šešta

Nors anglų kalba užėmė šeštą vietą, jos rezultatas nebuvo prastas. Vidutinis tikslumas siekė beveik 84 proc. Vis dėlto tai buvo prasčiau nei prancūzų, italų, ispanų ar rusų kalbų rezultatai.

Tyrėjai spėja, kad viena iš priežasčių gali būti didžiulė anglų kalbos įvairovė. Skirtingi dialektai, stiliai, trumpiniai ir laisva gramatika kartais apsunkina konteksto interpretaciją.

Be to, anglų kalba dažnai naudojama neformaliai, su daug užuominų ir dviprasmybių. Tai gali būti iššūkis net ir pažangiausiems dirbtinio intelekto modeliams.

Netikėtai silpnas kinų kalbos pasirodymas

Dar viena staigmena buvo kinų kalbos rezultatai. Ji užėmė ketvirtą vietą nuo galo tarp 26 testuotų kalbų. Tai nustebino, nes kinų kalbos duomenų dirbtinio intelekto mokymui yra itin daug.

Mokslininkai kol kas vengia daryti galutines išvadas, tačiau spėjama, kad rašmenų sistema ir kontekstinė kalbos struktūra gali kelti papildomų iššūkių. Ypač sudėtinga gali būti ilgesnių tekstų interpretacija.

Tai rodo, kad didelis duomenų kiekis nebūtinai garantuoja geriausią rezultatą.

O kaip lietuvių kalba

Tyrime lietuvių kalba nebuvo analizuojama. Todėl šiuo metu nėra aišku, kaip gerai dirbtinis intelektas supranta lietuviškai pateiktas užduotis lyginant su kitomis kalbomis.

Atsižvelgiant į lietuvių kalbos struktūrą ir turtingą gramatiką, rezultatai galėtų būti įdomūs. Tačiau tam reikalingi atskiri tyrimai ir duomenų analizė.

Kol kas lieka atviras klausimas, ar lietuvių kalba būtų artimesnė lenkų sėkmei, ar susidurtų su panašiais iššūkiais kaip kitos mažiau paplitusios kalbos.

Dešimt geriausiai dirbtinio intelekto suprantamų kalbų

Pagal tyrimo rezultatus, dirbtiniam intelektui suprantamiausių kalbų dešimtukas atrodo taip: pirmoje vietoje lenkų, antroje prancūzų, trečioje italų, ketvirtoje ispanų, penktoje rusų. Toliau seka anglų, ukrainiečių, portugalų, vokiečių ir olandų kalbos.

Šie duomenys keičia požiūrį į kalbų vaidmenį dirbtinio intelekto raidoje. Jie rodo, kad technologijų ateitis nebūtinai bus grindžiama vien anglų kalba.

Tyrimo autoriai pabrėžia, kad tokie rezultatai gali turėti įtakos ir tam, kaip ateityje bus kuriamos dirbtinio intelekto sistemos, pritaikytos skirtingoms kalbinėms rinkoms.

Ar patiko šis įrašas?
 

Rašau apie sodininkystę, gamtą ir gyvenimą. Tai temos, kurios man artimos širdžiai ir šaknims. Tikiu, kad augalai moko mus kantrybės, cikliškumo ir ryšio su pasauliu, todėl savo tekstais stengiuosi ne tik dalintis žiniomis, bet ir įkvėpti gyventi lėčiau, sąmoningiau, arčiau žemės.

0 komentarų

Rekomenduojame perskaityti

Taip pat skaitykite

Hey.lt - Nemokamas lankytojų skaitliukas