Tim istraživača sa univerziteta ETH Zurich, razvio je MetaGraph, revolucionarni alat koji omogućava pretragu ogromnih javnih DNK i RNK baza podataka za svega nekoliko sekundi, zbog čega je već dobio nadimak „Google za DNK“. Globalne genetske arhive danas sadrže skoro 100 petabajta podataka, što je približno količini svih tekstualnih informacija na internetu.
Klasične metode preuzimanja i analiziranja sekvenci postale su prespore i previše zahtevne za računare, dok MetaGraph kompresuje te podatke u pretraživi indeks koji omogućava trenutno pronalaženje sekvenci u milionima baza. Ova tehnologija može ubrzati istraživanja patogena, gena otpornosti na antibiotike i retkih genetskih poremećaja.
MetaGraph donosi revoluciju u biomedicinskim istraživanjima
DNK sekvenciranje je već transformisalo biomedicinu, omogućavajući otkrivanje naslednih bolesti, praćenje mutacija tumora i detekciju virusa poput SARS-CoV-2. Međutim, neprestano širenje javno dostupnih baza kao što su SRA i ENA stvorilo je ogroman problem obrade podataka. Do sada je pretraga određene sekvence zahtevala preuzimanje terabajta materijala, što je bilo sporo i skupo. MetaGraph rešava taj problem omogućavajući trenutan uvid u milione zapisa, čineći istraživanje genoma bržim i sveobuhvatnijim nego ikada.
MetaGraph uvodi sistem „punog teksta“ za genetske sekvence: istraživač unese DNK ili RNK niz i odmah dobije informaciju gde se on pojavljuje u javnim bazama. Sistem koristi složene matematičke grafove koji podatke čine visoko kompresovanim – do 300 puta manjim u odnosu na original – uz zadržavanje svih relevantnih informacija. Ovaj pristup omogućava ogromnu skalabilnost i minimalno povećanje resursa čak i kada količina podataka raste. Troškovi pretrage iznose manje od jednog dolara po megabazi, što MetaGraph čini i preciznim i ekonomičnim.
Upotreba u nauci i medicini
Zahvaljujući brzini i preciznosti, MetaGraph bi mogao u potpunosti promeniti tok genetskih istraživanja. Omogućava brzo pronalaženje gena otpornosti na antibiotike, identifikaciju bakteriofaga koji uništavaju štetne bakterije i proučavanje retkih patogena. U budućnosti bi se mogao koristiti i za analizu retkih genetskih bolesti ili za brzu reakciju na nove pretnje zarazom. Više od polovine javno dostupnih genetskih baza već je indeksirano, a ostatak će biti obuhvaćen do kraja godine. Pošto je alat otvorenog koda, koristan je i farmaceutskim kompanijama koje raspolažu sopstvenim velikim bazama podataka.
Istraživači sa ETH Zurich smatraju da bi MetaGraph mogao prevazići granice laboratorija. Kako navodi dr Andre Kales, pretraga DNK mogla bi postati deo svakodnevice: na primer, korišćena za identifikaciju biljnih vrsta kod kuće. Pretvarajući ogromne, kompleksne genetske arhive u lako pretraživu bazu, MetaGraph predstavlja veliki iskorak u bioinformatici i donosi naučnicima moćan alat za istraživanje „koda života“ brže i efikasnije nego ikada ranije, prenosi ToI.