Ohjelmistopaketti käsittelee valtavia määriä yksisoluisia tietoja

✅ Pelaaja Vinkki: PS3eye | PC Yhteensopiva | CL-Eye Ohjelmistopaketti + Linkki (Kesäkuu 2019).

Anonim

Helmholtz Zentrum Münchenin tutkijat ovat kehittäneet ohjelman, joka hallitsee valtavia aineistoja. Ohjelmisto, jota kutsutaan Scanpyksi, on ehdokas analysoimaan ihmisen soluatlasia, ja se on hiljattain julkaistu genomibiologiassa.

"Kyse on geneettisen ilmeisen datan analysoinnista suuresta määrästä yksittäisiä soluja", kertoo kirjailija Alex Wolf Laskennallisen biologian instituutista (ICB) Helmholtz Zentrum Münchenissa. Hän kehitti Scanpyä yhdessä kollegansa Philipp Angererin kanssa koneoppimisryhmän prof. Dr. Fabian Theisin kanssa. Hänen asemansa lisäksi Helmholtz Zentrum, Theis on myös professori matemaattinen mallinnus biologisten järjestelmiä Münchenin teknillisessä yliopistossa. "Uusi tekninen kehitys tuottaa useita suuruusluokkia enemmän tietoja, joilla on vastaavasti suurempi tietosisältö", Theis sanoo. "Gene-ilmentymistutkimuksen historiallisesti kehittynyt ohjelmistoinfrastruktuuri ei kuitenkaan yksinkertaisesti ole suunniteltu vastaamaan uusiin haasteisiin, joten tarvitaan uusia analyysimenetelmiä."

Ihmisolutulkukilpailu

Theisin mukaan suuri kansainvälinen tutkimushanke voisi myös hyötyä ohjelmistosta. Kansainvälisten tutkijoiden joukko laatii vertailutietokannan, jota kutsutaan ihmisen soluatlasiksi, jossa on tietoja kaikkien ihmisen solutyyppien geenitehtävistä. "Tätä hanketta varten ja yhä useammissa muissa hankkeissa, joissa tietokantoja yhdistetään, on tärkeää saada skaalautuva ohjelmisto", Theis sanoo. Siksi ei ole yllätys, että Scanpy on tällä hetkellä ehdokas auttamaan analysoimaan Human Cell Atlasia.

"Scanpyin julkaisu on ensimmäinen ohjelmisto, joka mahdollistaa laajan analyysin suurista geenien ilmentymistiedoista, joissa on laaja valikoima koneen oppimista ja tilastollisia menetelmiä", Wolf selittää saavutuksen. "Ohjelmistoa käyttävät jo useat ryhmät eri puolilla maailmaa, erityisesti Harvardin yliopiston laajassa laitoksessa ja MIT: n Massachusetts Institute of Technologyissa."

Teknologisesti sovellus on rytmikäs kehitys: kun biostatiikkaohjelmat on perinteisesti kirjoitettu ohjelmointikielellä R, Scanpy perustuu koneen oppimisympäristön hallitsevaan kieleen. Toinen uusi piirre on, että graafiset algoritmit ovat Scanpyin ytimessä. Toisin kuin tavallinen lähestymistapa solujen käsittelemiseksi pisteinä koordinaattijärjestelmässä geenien ilmentymistilassa, algoritmit käyttävät kaaviomaista koordinaatistoa. Sen sijaan, että yksi solu tunnistettaisiin tuhansien geenien ilmentymisarvolla, järjestelmä yksinkertaisesti luonnehtii soluja tunnistamalla lähimmät naapurit - aivan kuten sosiaalisten verkostojen yhteydet. Itse asiassa solutyyppien tunnistamiseksi Scanpy käyttää samoja algoritmeja kuin Facebook tunnistaa yhteisöjä.

menu
menu