Lūžis Lietuvos moksle: atverta duomenų saugykla gali iš esmės pakeisti biomedicinos tyrimus

Paskelbė Viktorija Jasiūtė
Paskelbta

Lūžis Lietuvos moksle: atverta duomenų saugykla gali iš esmės pakeisti biomedicinos tyrimus
Lietuvoje netrukus pradės veikti pirmoji atvira gamtos ir biomedicinos mokslų duomenų saugykla, kurioje ne tik kaupiami duomenys, bet ir sudaromos sąlygos atkartoti mokslinius tyrimus.

Vilniaus universitete įdiegta, 0,5 mln. eurų kainavusi duomenų saugojimo platforma bus atvira ir prieinama mokslininkams, studentams, įmonėms bei startuolių kūrėjams. Tikimasi, kad ši infrastruktūra ypač pasitarnaus medicinai. Vienas pirmųjų joje vystomų projektų – sprendimas, padėsiantis gydytojams lengviau atpažinti širdies ligas.

Atvira saugykla gamtos ir biomedicinos mokslų duomenims

Naujoji duomenų saugykla įdiegta Vilniaus universiteto Duomenų centre, skirtame mašininiam mokymui ir kvantiniams skaičiavimams gamtos ir biomedicinos mokslų srityse. Čia kaupiami jau turimi ir naujai gaunami įvairūs heterogeniniai duomenys: vaizdai, tekstai, eksperimentų rezultatai ir kita informacija. Prie duomenų pridedama metainformacija, kuri leidžia atsekti jų kilmę, atlikti paiešką ir panaudoti juos naujiems tyrimams.

Duomenys bus prieinami visiems norintiems pagal FAIR (angl. findable, accessible, interoperable, reusable) principus ir naudojami moksliniams tyrimams, mašininio mokymosi bei dirbtinio intelekto algoritmams kurti ir testuoti. Būtent toks buvo prieš kelerius metus įkurto centro tikslas.

Tyrimai, kuriuos galima patikrinti

„Duomenų atvėrimas ir apskritai atviras mokslas šiandien tampa įprasta praktika visame pasaulyje, todėl Lietuvai svarbu judėti ta pačia kryptimi. Tai atveria galimybes pažangai medicinos diagnostikos, kristalografijos ir kitose su gyvybės mokslais susijusiose srityse, kurti naujas technologijas ir ugdyti jaunąją tyrėjų kartą“, – sako VU Duomenų centro vadovė ir VU Matematikos ir informatikos fakulteto profesorė Jurgita Markevičiūtė.

Pasitelkus skaičiavimo resursus, duomenų centre bus galima visiškai atkartoti anksčiau atliktus tyrimus: naudoti tuos pačius duomenis, paleisti savo modelius ir palyginti skirtingų tyrimų rezultatus.

„Tai labai svarbu atvirojo mokslo kontekste, nes leidžia įvertinti, ar tyrimų išvados yra patikimos ir tinkamos taikyti praktikoje. Iki šiol mūsų šalyje nebuvo infrastruktūros, kuri tai leistų padaryti“, – teigia centro vadovė. Be to, saugykloje saugomi ir pirminiai duomenys, ir jų kopijos, todėl, pakartojus tyrimą, sudaromos sąlygos išsaugoti ir naują jo versiją.

Kaip buvo kuriama duomenų saugojimo infrastruktūra?

Duomenų saugojimo platformą suprojektavo ir įdiegė technologijų bendrovė „3RTechnology“. Pasak bendrovės vadovo Rėdo Šimelio, projekte naudota „Dell“ įranga kaip modulinė bazė, ant kurios buvo sukurta visa duomenų saugojimo ir skaičiavimo architektūra.

Platformoje integruoti keturi skirtingi serverių modeliai, pritaikyti konkrečioms funkcijoms. Vienas jų – GPU akseleruotas serveris su keturiais NVIDIA H100 80 GB SXM5 akseleratoriais, skirtais mašininiam mokymui, dideliems dirbtinio intelekto modeliams ir sudėtingiems skaičiavimams. Platforma paremta atvirojo kodo (open-source) technologijomis ir suplanuota taip, kad ateityje būtų galima ją lengvai plėsti.

„Tai vienas iš nedaugelio tokių kompleksiškų projektų Lietuvoje, kai daugiau nei 1 PB talpos CEPH pagrindu veikianti greitoji saugykla, daugiau nei 1 PB archyvinė saugykla ir GPU akseleruota DI infrastruktūra suprojektuotos kaip viena vientisa sistema“, – aiškina R. Šimelis.

Siekia palengvinti darbą gydytojams

VU Matematikos ir informatikos fakulteto doktorantas Jonas Mindaugas Rimšelis teigia, kad naujoji duomenų saugykla iš esmės pakeis jo įgyvendinamo projekto, orientuoto į širdies ligų diagnostiką, galimybes.

„Širdies ir kraujagyslių ligos yra viena dažniausių mirties priežasčių Europoje, o vienas iš būdų jas diagnozuoti – taikant Holterio monitoravimo aparatą. Tačiau šiuo metodu užfiksuojami gana triukšmingi EKG signalai. Mes taikome difuzinius tikimybinius modelius siekdami pašalinti šiuos triukšmus, kad gydytojams būtų lengviau ir tiksliau identifikuoti širdies veiklos sutrikimus“, – pasakoja J. M. Rimšelis.

Pasak doktoranto, naudodamasis naująja duomenų saugykla jis galės dirbti su gerokai didesniais duomenų kiekiais ir užtikrinti, kad jo sukurti modeliai būtų lengvai patikrinami bei pakartojami kitų tyrėjų. Tai sustiprins pasitikėjimą rezultatais, sudarys sąlygas glaudesniam bendradarbiavimui su kitais mokslininkais ir leis nuolat tobulinti kuriamą sprendimą.

Ar patiko šis įrašas?
 

Rašau apie sveikatą, gerą savijautą, stilių ir grožį, siekdama padėti skaitytojams jaustis geriau tiek fiziškai, tiek emociškai. Mano tekstai orientuoti į praktiškus patarimus, subalansuotą požiūrį ir kasdienius pasirinkimus, kurie prisideda prie gyvenimo kokybės. 

0 komentarų

Rekomenduojame perskaityti

Taip pat skaitykite

Hey.lt - Nemokamas lankytojų skaitliukas