Mynd: UC Berkely

Erfðamengi mannsins var fyrst raðgreint rétt uppúr aldamótum. Tilkynningin barst eftir mikið kapphlaup milli bandarískra rannsóknarhópa sem annars vegar voru styrktir af National Institutes of Health í Bandaríkjunum og hins vegar einkafyrirtækinu Celera Genomics.

Áður en raðgreining hófst höfðu margir reynt að giska á hversu mörg gen erfðamengi mannsins taldi. Til að útskýra þá gríðarlegu yfirburði sem maðurinn hafði yfir aðrar dýrategundir þótti augljóst að genafjöldi hlyti að vera margfalt meiri.

Eftir fjölda ágiskana, sem yfirleitt voru byggðar á einhvers konar rannsóknarvinnu komust hóparnir að þeirri niðurstöðu að líklegur fjöldi væri milli 25.000 og 50.000 gen. Einhverjir vildu þó halda því fram að þau væru nær 100.000. Það voru því talsverð vonbrigði fyrir marga þegar raðgreiningu lauk og í ljós kom að fjöldinn var sennilega rétt um 25.000 gen.

Tilkoma raðgreininganna
Raðgreining á erfðaefni er að mestu leyti samvinna tveggja mikilvægra þátta: nákvæmra efnahvarfa og tækni til að lesa þessi efnahvörf. Efnahvarf sem setur af stað myndun á nýju DNA-i er kvikmyndað þegar hún fer fram í þessum stóru vélum sem ganga undir nafninu raðgreinar.

Efnahvörfin eru keyrð áfram með sömu einingum og keyra áfram myndun erfðaefnis í líkömum okkar og annarra dýra. Byggingareiningar erfðaefnisins, núkleótíðin eru merkt með sérstökum litum og þegar nýju núkleótíði er bætt á DNA keðjuna er liturinn skráður í tækið. Það var með tilkomu þessara flóknu tækja sem aðstæður sköpuðust til að skilgreina allt erfðamengi mannsins.

Hvernig þekkjum við genin
Þegar verið er að raða saman erfðamenginu þarf fyrst og fremst að raða bútunum saman í raunhæfa röð. Raðgreiningin gerist nefnilega í bútum sem yfirleitt ná tilviljanakennt yfir 100-1000 basapara svæði. Þegar búið er að raða bútunum í raunhæfa röð hefst vinnan við að leita að genum.

Genin falla inní ákveðinn strúktúr í erfðaefninu, fyrir framan genið eða nálægt því þarf að vera stýrilröð. Inní geninu þarf að vera svokallaður startkóði, en það er þriggja basa DNA kóði sem fruman notar til að þekkja upphafið á prótíninu.

Síðast en ekki síst hjálpar til ef genin líkjast öðrum þekktum genum úr öðrum lífverum. Það kemur kannski á óvart en hlutfall gena sem eru sértæk fyrir manninn er mjög lágt. Í flestum tilfellum er sömu genin, og þar með prótínin, að finna í nánustu ættingjum okkar (öðrum spendýrum) með smávægilegum breytingum inní röðinni eða jafnvel í fjölda gena í erfðamenginu.

Ekki má gleyma að vegna eiginleika erfðaefnisins eru sum svæði erfiðari til raðgreiningar en önnur. Það getur til dæmis reynst þrautin þyngri að raðgreina svæði í erfðamenginu þar sem er mikið af endurtekningum, einfaldlega vegna þess að raðgreinarnir eiga erfitt með að skilja það. Þess vegna fer gríðarleg vinna í að lesa úr röðunum sem fást við raðgreininguna, raða þeim saman og skilja hvað þær tákna.

Raunverulegur fjöldi
Með allar þessar upplýsingar getur verið erfitt að sjá trén fyrir skóginum. Erfðamengi úr einum einstakling inniheldur ógrynni af upplýsingum, um það bil 3 milljarða basapara sem aðeins að litlum hluta skrá fyrir eiginlegum prótínum.

Mjög stór hluti erfðamengisins gegnir annars konar hlutverki, tilheyrir innröðum, stýrilröðum eða virðast ekki hafa neitt hlutverk. Má þar meðal annars nefna sem dæmi svokölluð gervigen eða pseudogenes, sem hafa ýmsa eiginleika gena en uppfylla ekki allar forsendur þess. Þessi gervigen geta verið leifar af genum sem hafa gengið í gegnum margvíslegar breytingar í þróun lífverunnar.

Stöðugar endurbætur
Þó raðgreiningu á erfðamengi mannsins hafi formlega lokið í kringum aldamót er ekki öll sagan sögð. Við tóku tímar þar sem unnið hefur verið að því að skilgreina nákvæman fjölda gena sem skrá fyrir prótínum, vinnueiningum frumunnar. Á sama tíma hefur einnig verið unnið að því að skilgreina hltuverk prótínanna.

Í þessu samhengi er oft talað um prótínmengi, á sama hátt og talað er um erfðamengi. Afrakstur vinnu síðastliðinna ára við söfnun upplýsinga um prótínmengi mannsins má finna í þremur stórum gagnabönkum, GENCODE/Ensembl, RefSeq og UniProtKB. Saman geyma þessir gagnabankar upplýsingar um öll prótínkóðandi gen mannsins og sennilega meira til.

Rýrnun prótein-mengisins
Rannsóknarhópur leiddur af Michael Tress birti nýverið niðurstöður rannsóknar sinnar á próteinmengi mannsins. Í rannsókninni leiða saman hesta sína vísindamenn frá CNIO Bioinformatics Unit, Wellcome Trust Sanger Institute í Bretlandi, MIT í Bandaríkjunum, Pompeu Fabra University og BSC-CNS í Barcelona, ásamt CNIC í Madrid.

Hópurinn notað fyrrnefnda gagnagrunna til að skilgreina hvaða gen skrá raunverulega fyrir prótínum. Með því að bera saman gen sem eru tiltekin í hverjum gagnagrunni fyrir sig komst hópurinn að því að í gagnagrunnunum eru samtals 4234 gen sem að öllum líkindum skrá ekki fyrir prótínum.

Hópurinn skoðaði fyrst hvaða gen koma einungis fyrir í einum eða tveimur af gagnagrunnunum þremur og fann þá 2764 gen. Þessi gen og önnur 1470 sem finnast í öllum gagnagrunnum áttu það mörg hver sameiginlegt að fylla ekki uppí þær forsendur sem þurfa að vera til staðar svo genið teljist skrá fyrir prótíni, mörg genanna voru svokölluð gervigen (pseudogenes).

Raunverulegur fjöldi gena
Samkvæmt þessum niðurstöðum er raunverulegur fjöldi gena í erfðamengi mannsins sem skrá fyrir prótínum 19.446. Þessi tala, sem gæti mögulega minnkað enn frekar, er töluvert langt frá háleitum hugmyndum vísindamanna um 100.000 gen í erfðamengi mannsins.

Fjöldi gena skiptir þó ekki höfuðmáli í þessu samhengi. Það er kannski hjákátlegt að vera að telja gen þegar maðurinn er augljóslega eina dýrategundin sem hefur tekist að raðgreina eigið erfðamengi.

Hvernig þessi gen og aðrar raðir í erfðamenginu starfa er það sem skiptir höfuðmáli í þessu samhengi. Rannsóknir sem snúast um gen sem líklega gegna engu hlutverki í mannslíkamanum eru í besta falli sóun á peningum en í versta falli til þess gerðar að búa til falskar upplýsingar.

Þess vegna eru rannsóknir sem þessar, sem birtar voru í vísindaritinu Nucleic Acids Research, mjög mikilvægar. Þær samræma vitneskju okkar um erfðamengið og gefa okkur tækifæri til að sjá viðfangsefnið í réttu samhengi.

Fréttin birtist fyrst í tímariti og á vefsíðu Stundarinnar