Mittekodeeriv DNA

Genoomikas ja sellega seotud distsipliinides mõistetakse mittekodeeriva DNA all organismi DNA-järjestusi, mis ei kodeeri valke. Mõned mittekodeerivad DNA lõigud transkribeeritakse funktsionaalseks mittekodeerivateks RNA (ncRNA) molekulideks (transport-RNA, ribosomaalne RNA ja regulatoorsed RNA-d), samas kui muid mittekodeerivaid DNA järjestusi ei transkribeerita või nende transkriptide omadusi ei teata. Mittekodeeriva DNA hulk genoomis varieerub liikide piires suuresti. Näiteks inimese genoom koosneb üle 98% mittekodeerivast DNA-st, samas kui näiteks bakteritel moodustab see keskmiselt ainult 2% genoomist.

Varem oli suure osa mittekodeeriva DNA bioloogiline funktsioon teadmata või arvati, et nad on funktsioneerinud minevikus ning seetõttu on seda nimetatud ka "rämps-DNA-ks" (inimese genoomis 78%).[1] Kuid siiski on teada, et paljudel valke mittekodeerivatel DNA järjestustel on oma funktsioon täiesti olemas – näiteks geenid funktsionaalsete, kuid valke mittekodeerivate RNA molekulide jaoks, järjestused, mis on vajalikud valke kodeerivate järjestuste transkriptsiooni ja translatsiooni regulatsioonil, DNA replikatsiooni alguskohad, tsentromeersed ja telomeersed järjestused jms.

Mittekodeerival DNA-l on oluline ka kromosoomide kuju määramisel ja oluline osa sellest DNA-st transkribeeritakse RNA-ks.[2]

Mõned DNA järjestused, näiteks endogeensete retroviiruste omad, on organismi genoomis organismile ka otseselt mittevajalikud.

USA Riikliku Inimgenoomi Uuringute Instituudi (US National Human Genome Research Institute (NHGRI)) projekti raames koostatud DNA elementide entsüklopeedias (Encyclopedia of DNA Elements (ENCODE))[3] märgitakse 2012. aasta septembri seisuga, et üle 80% DNA-l inimgenoomis on mingi biokeemiline funktsioon. Sellist järeldust on aga paljud teadlased tugevalt kritiseerinud.[4][5]

Mittekodeeriva DNA hulk genoomis

Erinevate organismide genoomide suurused on erinevad palju ning samuti ka genoomides olev valke kodeeriva ja mittkodeeriva DNA suhte. Näiteks inimgenoomist moodustab mittkodeeriv DNA intronite, intergenoomse DNA ja muude järjestustega kokku rohkem kui 98% genoomist.

Mittekodeeriva DNA hulk ja üldine genoomi suurus on tihti korrelatsioonis organismi keerukusega, kuid esineb ka mitmeid erandeid. Näiteks üherakulise organismi Polychaos dubium (varem nimetatud Amoeba dubia) genoom sisaldab 200 korda rohkem DNA-d kui inimese genoom, samas kui puhverkalalise Takifugu rubripes genoomi suurus on kõigest üks kaheksandik inimgenoomist, kuid sisaldab võrreldaval arvul geene. Taikofugu genoomist moodustab mittekodeeriv DNA 90%. 2013. aastal avastati kõige efektiivsema genoomi omamises uus "rekordiomanik" – ühel vesiherneliste perekonda kuuluval taimel, Utricularia gibba moodustab mittekodeeriv DNA kogu genoomist kõigest 3%.
Eukarüootsete genoomide suurt varieeruvust ja mittekorreleeruvust organismi keerukusega nimetatakse C-väärtuse paradoksiks. On leitud ka, et enamik genoomide vahelisi suuruste erinevusi tuleneb mittekodeerivast DNA-st.
Kuigi ligikaudu 80% inimgenoomist võib olla transkribeeritav, ei tähenda see seda, et kõigil transkriptidel oleks mingi funktsioon.

Mittekodeerivate DNA järjestuste tüübid

Mittekodeeriv funktsionaalne RNA

Mittekodeerivad RNA molekulid on organismis mingit funktsiooni omavad RNA-d, mida ei transleerita valkudeks (näiteks ribosomaalne RNA).

Cis- ja trans-toimelised elemendid

DNA elemendid, miks kontrollivad DNA lõigul enda lähedal või eemal asuvate geenide transkriptsiooni.

Intronid

Intronid on geenis olevad valke mittekodeerivad järjestused mida transkribeeritakse küll prekursor mRNA-sse, kuid eemaldatakse splaissimise käigus.

Pseudogeenid

Pseudogeenid ehk kunagi funktsioneerinud ürgsed geenid on DNA järjestused, mis on tänapäeval kaotanud, kas evolutsiooni käigus või mõnel muul põhjusel oma valke kodeerivad omadused.[6]

Kordusjärjestused, transposoonid ja viraalsed elemendid

Transposoonid ja retrotransposoonid on mobiilsed geneetilised elemendid.

Telomeerid

Telomeerid on kordusjärjestustest koosnevad kromosoomide otstes paikned DNA regioonid, mis kaitsevad genoomi DNA replikatsiooni ajal.

"Rämps-DNA"

Väljend "rämps-DNA" hakkas populaarsust koguma 1960. aastatel. Mõiste esmaseks formuleerijaks 1972. aastal oli Aasia-Ameerika geneetik ja evolutsioonibioloog Susumu Ohno.[7] Ta märkis oma 1972. aastal ilmunud artiklis, et teadaoleva, tüüpilise mutatsioonide tekke sageduse juures on võimalike funktsionaalsete geenilookuste tekkimise arv piiratud, ehk ülempiiriga. Ohno ennustas, et imetajatel ei saa tekkida rohkem kui 30 000 geenilookust, kuna suurema arvu korral mutatsioonide tekke sagedus aluspaaride kohta ajas kaaluks üle geenidest saadava kasu kohastumusele ja (tekkiv "rämps-DNA") põhjustaks vältimatu kohastumuse vähenemise ja lõpuks tõenäoliset ka väljasuremise. Sellist ennustust peetakse üsna robustseks. Inimgeenoomis on näiteks ligikaudu 20 000 geeni.
Teine allikas Ohno teooriale "rämps-DNA"-st tulenes vaatlustest, et isegi lähedalt seotud liikide genoomid võivad üksteise suhtes olla suuruselt väga erinevad (erinevused magnituudides), mida teatakse 1971. aastast ka kui C-väärtuse paradoksi.

Mittekodeeriva DNA bioloogilised funktsiooind

Paljud mittekodeerivad DNA järjestused omavad tähtsaid bioloogilisi funktsioone. Võrdleva genoomika uurimustest on tulnud välja, et mõned mittekodeerivad DNA regioonid on tugevalt konserveerud, olles püsinud genoomis mõnel juhul isegi kümneid kuni sadu miljoneid aastaid, viidates, et need järjestused on olnud tugeva evolutsioonilise surve ja positiivse selektsiooni all.[8] Näiteks inimese ja hiire genoomides, kelle lahknemine ühisest eellasest toimus umbes 65–75 miljonit aastat tagasi, on nii inimesel kui ja hiirel sarnaseid valke kodeerivaid järjestusi konserveerunud DNA-st ligikaudu 20%, samas kui ülejäänud 80% konserveerunud DNA-st moodustavad mittekodeerivad järjestused.[9] (inimese kogu genoom on 97,5% ulatuses hiirte omaga sama[10]) Geenide aheldatuse kaardistamisel tulevad tihti välja sellised kromosomaalsed regioonid, mida seostatakse teatud haigustega, kuid puuduvad tõendid, et nendes regioonides oleks funktsioneerivaid, valke kodeerivaid geene, mis viitab, et haigust põhjustav geneetiline materjal on mittekodeerivas DNA-s.[9]

Geenide ekspressiooni regulatsioon

Mõned mittekodeerivad DNA järjestused määravad osade geenide ekspresseeritavuse määra.[11]

Viited