"Big Data" ressurss tõstatab teadusuuringute revolutsiooni võimaluse

The Secret Life of Big Data | Intel (Juuli 2019).

Anonim

Bristoli ülikooli teadlaste hulka kuuluvate Suurbritannia teadlaste rühm on näidanud, kuidas kogu maailma laboratooriumide piltide andmete koondamine võib viia teaduslike uuringute muutumiseni.

Image Data Resource (IDR) on koostöö Dundee'is asuva avatud mikroskoopia keskkonnas (OME) asuvate teadlaste ning Cambridge'i ja Bristoli ülikoolide ning Euroopa Bioinformaatika Instituudi (EMBL-EBI) vahel. Koostöö koondab bioloogid, pilditööstuse spetsialistid, suured andmeteadlased ja arvutiteadlased.

Professor Jasoni Swedlowi juhitud meeskond Dundee elupäevakoolis on loonud avaliku andmebaasi, mis kogub ja integreerib juhtivates teadusajakirjades avaldatud katsetega seotud pilditöötlusandmeid (Image Data Resource, IDR). See tähendab, et kogu maailmas teadlaste poolt läbi viidud pilditöötluskatsetest "suured andmed", mis varem olid liiga suured ja neid on raske jagada, on nüüd avalikult kättesaadavad.

Esmase uurimistöö andmete kättesaadavus on teaduse edendamiseks eluliselt tähtis, kuid üksikute teadlaste esitatud piltide andmekogude võrdlemine ja analüüsimine on teadlaste jaoks üsna raske. Pildid on suured, koormavad, keerukad ja heterogeensed. Nad on harva üldsusele kättesaadavad ja kuigi need kujutavad endast kujutiseandmete kogumise ja säilitamise erinevaid vahendeid, ei saa neid hõlpsasti taasesitada, võrrelda ega uuesti analüüsida.

IDR automatiseerib neid protsesse ja tõmbab üksikuid sarnaseid teadusuuringuid koos, et luua suur teadmistepank, mis võib päästa teadlasi aega, jõudu ja raha, samal ajal kui järjepidevalt esile tuua varem uurimata valdkondi, millel on potentsiaal lahendada teaduslikke saladusi. See tasuta ressurss on esimene üldine bioloogilise kujutisehoidla, mis salvestab ja integreerib andmeid mitmest modaalsusest ja laboritest.

Professor Swedlow selgitas: "Teadlased teevad üksteisega koostööd ja peegeldavad koosolekute ja avaldatud paberite ülemaailmse teadusliku kogukonna uurimistööd, kuid nende kommunikatsioonide aluseks olevaid piltide andmekogumeid ei avaldata peaaegu kunagi. Selle tulemusena on suur hulk teave, mida ei saa jagada, juurde pääseda, võrrelda ega mõista.

"IDR muudab need andmekogud kättesaadavaks ja võimaldab teadlastel kogu maailmas neid pildistamisandmeid ühendada, mineerida ja analüüsida. Võimalus kiirendada teadusuuringute ja lingidokumentide kogumit, et teadlased saaksid otsida mudeleid ja ühiseid jooni, on tohutu. Isegi enne IDR-i ametlikku väljakuulutamist, Mul oli kontakte rakubioloogidelt, ravimite avastamise teadlastelt ja süvaõppe arendajatest, kes küsivad, kas nad saavad IDRi kasutada. "

IDR kogub ja integreerib paljude erinevate pildistamismeetodite abil saadud pildiandmeid. See seob suuremahulisi sõeluuringuid, eraldusvõimega mikroskoopiat, aeg-ajalt ja digitaalse patoloogia pildistamise eksperimente avalikesse geneetilistesse või keemilistesse andmebaasidesse. IDR sisaldab ka teavet katseliste protokollide, pildistamise parameetrite, analüüside ja rakkude ja koe muutuste kohta, mida teadlased on täheldanud.

Kasutades IDRi, professor Swedlow ja tema kolleegid Open Microscopy Keskkonna (OME) konsortsiumi leidis seoseid erinevate uurimisprojektide vahel, mis olid elanud üksikute teadlaste jaoks. Nad tuvastasid erinevatest uuringutest pärit geenid, mis muteerudes või eemaldades põhjustasid rakkude pikenemist ja venitamist.

Nad koondasid erinevatest uuringutest geenijärjestused ja lõid geenivõrgu, mis annab täieliku pildi geenide konformatsioonist, üks omadustest, mis muutuvad metastaatilise vähi korral. Pikenemine on vaid üks rohkem kui 150 efekti rakkudele, mida IDR praegu registreerib, mis tähendab, et on oodata veel olulisi avastusi.

See valdkond on biotehnoloogiatööstusele ja ravimite avastamise ettevõtetele väga huvipakkuv, kuna see võimaldab tuvastada uusi ravimeetodeid ja sihtmärke ning laiendada teadusuuringute ulatust, võimaldades teadlastel üksteise andmekogudele juurde pääseda.

"Kujundamine on teaduse jaoks tõeliselt teisendatav, kui teeme andmed avalikult kättesaadavaks, " selgitab EMBL-EBI juhendaja ja vanemteadur Alvis Brazma. "Teadlastel peaks olema võimalik küsida olemasolevaid andmeid ühiste joonte ja mustrite väljaselgitamiseks. Kuid selleks, et oleks võimalik, on meil vaja kindlat platvormi, kus teadlased saaksid oma pilditöötlusandmeid üles laadida ja hõlpsasti juurde pääseda muude eksperimentide andmetele. Image Data Resource on esimene samm luua loodusteaduste avalik pilditöödehoidla. "

Professor Rafael Carazo Salas, kes juhtis IDRi meeskonda Cambridge'is ja Bristol'is, ütles: "Reprodutseeritavus ja korduskasutamine on teadusringkondade peamised probleemid. Oleme näidanud, kuidas nad võivad teadusuuringuid tõhustada, integreerides ja ristvalifitseerides erinevaid pildistusuuringuid ja mis võimaldab luua avastusi, lisandväärtust ja investeeringute tasuvuse suurenemist, mida ei olnud võimalik individuaalsetest uuringutest eraldi saada.

"IDR on maailma juhtiv mitte ainult avastuste tõttu, mida see teeb esmakordselt võimalikuks, vaid ka seetõttu, et see on avatud lähtekoodiga platvorm, mida teised saavad oma kujutiseandmete avaldamiseks kasutada. Seega pakub IDR nii uudset veebipõhist ressurssi kui ka tarkvara infrastruktuur, mis edendab ja laiendab teaduslike kujutiste andmete avaldamist ja uuesti analüüsimist. "

menu
menu