ARN nucleolar pequeno

O ARN nucleolar pequeno[1] (ARNnop[1] ou snoRNA nas súas siglas en inglés) é un tipo de pequenas moléculas de ARN que teñen como principal función dirixir a modificación química doutros ARN, fundamentalmente os ARN ribosómicos, ARN de transferencia e ARN nucleares pequenos. Hai dúas clases principais de snoRNA, os snoRNAs da caixa C/D, que están asociados á metilación, e os snoRNAs da caixa H/ACA, que están asociados á pseudouridilación.Os snoRNA denomínanse normalmente "ARN guías" pero non deben confundirse cos ARN guías que dirixen a modificación (editing) do ARN nos tripanosomas. Os snoRNA están asociados formando complexos con proteínas, que se denominan ribonucleoproteínas nucleolares pequenas ou snoRNP.

Modificacións dirixidas polos snoRNA

Despois da transcrición, as moléculas de ARNr que se están a formar (denominadas pre-ARNr) deben de sufrir un procesamento para converterse en ARNr maduro. Antes da súa escisión pola acción de exo- e endonucleases o pre-ARNr sofre unha complexa serie de modificacións nos seus nucleósidos, que inclúen metilacións e pseudouridilacións, as cales son dirixidas polos snoRNAs.

  • Metilación é a unión ou substitución de grupos metilo en diversos substratos. O ARNr humano presenta aproximadamente 115 modificacións de grupos metilo. A maioría destas son metilacións 2'O-ribosa (nas que o grupo metilo se une á ribosa).[2]
  • Pseudouridilación é a conversión (isomerización) do nucleósido uridina a unha forma isomérica distinta, a pseudouridina (Ψ). Os ARNr maduros humanos presentan aproximadamente 95 modificacións Ψ.[2]

Cada molécula de snoRNA actúa como guía para facer só unha (ou dúas) modificacións individuais nun ARN diana. Para levar a cabo estas modificacións, cada snoRNA asóciase con polos menos catro moléculas proteicas formando un complexo ARN/proteína denominado ribonucleoproteína nucleolar pequena (snoRNP). As proteínas que se asocian con cada ARN dependen do tipo de molécula de snoRNA de que se trate (ver as familias de snoRNA guía máis abaixo). A molécula de snoRNA contén un elemento antisentido (un tramo de 10-20 nucleótidos) que ten complementariedade de bases coa secuencia que rodea a base (nucleótido) obxectivo da modificación na molécula do pre-ARN. Isto permite que a snoRNP recoñeza e se una ao seu ARN obxectivo. Unha vez que a snoRNP se uniu ao seu sitio obxectivo, as proteínas asociadas están no lugar fisicamente correcto para catalizar a modificación química da base obxectivo.

Familias de snoRNA guía

Os dous tipos de modificacións do ARNr (metilación e pseudouridilación) son dirixidas por dous tipos diferentes de familias de snoRNA. Estas familias de snoRNA denomínanse snoRNA de caixa C/D antisentido e snoRNA de caixa H/ACA, distinción que está baseada na presenza de motivos de secuencia conservados nos snoRNA. Aínda que hai excepcións, como regra xeral os membros da caixa C/D (C/D box) dirixen a metilación e os membros H/ACA dirixen a pseudouridilación. Os membros de cada familia poden variar en bioxénese, estrutura e función, pero cada familia clasifícase polas seguintes características xerais. Para máis detalles ver a revisión.[3]Os snoRNA clasifícanse dentro dos ARN nucleares pequenos no MeSH.

snoRNA de caixa C/D

Exemplo de estrutura secundaria dun snoRNA de caixa C/D tomado da base de datos Rfam. Este exemplo é o snoRNA SNORD73 (RF00071).

Os snoRNA de caixa C/D conteñen dous curtos motivos de secuencia conservados, C (UGAUGA) e D (CUGA) localizados preto dos extremos 5' e 3' do snoRNA respectivamente. Rexións curtas (~ 5 nucleótidos) situadas corrente arriba da caixa C e corrente abaixo da caixa D son normalmente complementarias en bases e forman unha estrutura caixa-talo que pon os motivos das caixas C e D en estreita proximidade. Esta estrutura caixa-talo é esencial para a correcta síntese dos snoRNA e para a súa localización nucleolar.[4] Moitos snoRNA de caixa C/D conteñen tamén unha copia adicional menos conservada dos motivos C e D (denominada C' e D') situada na porción central da molécula de snoRNA. Unha rexión conservada de 10-21 nucleótidos situada corrente arriba da caixa D é complementaria do sitio de metilación do ARN diana e permite que o snoRNA forme un dúplex de ARN co ARN.[5] O nucleótido que debe ser modificado no ARN diana está localizado normalmente na quinta posición corrente arriba a partir da caixa D (ou da caixa D').[6][7] Os snoRNA de caixa C/D asócianse con catro proteínas esenciais conservadas na evolución, que son en eucariotas: fibrilarina (Nop1p), Nop56p, Nop58p, e Snu13 (o seu homólogo en arqueas é L7Ae)) as cales forman o núcleo das snoRNP de caixa C/D.[3]

Existe tamén un snoRNA de caixa C/D eucariótico (snoRNA U3) que non se viu que dirixa metilacións 2'-O.En vez diso, funciona dirixindo a escisión do pre-ARNr.

snoRNA de caixa H/ACA

Exemplo de estrutura secundaria dun snoRNA de caixa H/ACA tomado da base de datos Rfam. Este exemplo é o snoRNA SNORA69 (RF00265).

Os snoRNA de caixa H/ACA teñen unha estrutura secundaria común que consiste en dúas forquitas e dúas rexións dunha soa cadea chamadas estruturas forquita-bisagra-forquita-cola.[3] Os snoRNA de caixa H/ACA tamén conteñen motivos de secuencia conservados coñecidos como caixa H (consenso ANANNA) e a caixa ACA (ACA). Ambos os motivos están normalmente situados nas rexións dunha soa cadea da estrutura secundaria. O motivo H está localizado na bisagra e o motivo ACA na rexión da cola, a 3 nucleótidos do extremo 3' da secuencia.[8] As rexións forquita conteñen protuberancias internas coñecidas como bucles de recoñecemento, nos cales están localizadas as secuencias guía antisentido (complementarias en bases coa secuencia obxectivo). Esta secuencia de recoñecemento é bipartita (construída a partir de cada un dos dous brazos da rexión bucle) e forma pseudonós complexos co ARN obxectivo. O snoRNA de caixa H/ACA asócianse con catro proteínas esenciais conservadas evolutivamente, que son: disquerina (Cbf5p), Gar1p, Nhp2p e Nop10p, que forman o núcleo das snoRNP de caixa H/ACA.[3] Porén, en eucariotas inferiores como os tripanosomas, existen ARN similares na forma de estrutura en forquita simple e unha caixa AGA en lugar da caixa ACA no extremo 3' do ARN.[9]

O compoñente ARN da telomerase humana (hTERC) contén un dominio H/ACA para a formación de pre-RNP e a localización nucleolar da propia RNP telomerase.[10] Un dato importante é que a snoRNP H/ACA foi implicada na rara enfermidade xenética disqueratose conxénita debido á súa asociación coa telomerase humana. As mutacións no compoñente proteico da snoRNP H/ACA orixinan unha redución dos niveis fisiolóxicos de telomerase (TERC). Isto foi claramente correlaciondo coa patoloxía asociada á disqueratose conxénita, a cal parece ser unha doenza producida principalmente por un deficiente mantemento do telómero.

snoRNA compostos de caixa H/ACA e C/D

Identificouse un snoRNA U85 guía pouco común que funciona tanto na metilación 2'-O-ribosa coma na pseudouridilación do ARN nuclear pequeno (snRNA) U5.[11] Este snoRNA composto contén tanto dominios de caixa C/D coma de H/ACA e asóciase coas proteínas específicas de ambas as clases de snoRNA (fibrilarina e Gar1p respectivamente). Foron caracterizados máis snoRNA compostos.[12]

Estes snoRNA compostos viuse que se acumulan nun orgánulo subcelular chamado corpo de Cajal e denomínanse ARN específicos dos corpos de Cajal. Isto contraponse ao que se observa na maioría dos snoRNA de caixa C/D ou de caixa H/ACA, os cales se localizan no nucléolo. Estes ARN específicos dos corpos de Cajal suponse que poden estar implicados na modificación dos ARN espliceosomais U1, U2, U4, U5 e U12 transcritos pola ARN polimerase II.[12] Non todos os snoRNA que foron localizados nos corpos de Cajal son snoRNA compostos de caixa C/D e H/ACA.

snoRNA "orfos"

As dianas de novos snoRNA identificados recentemente poden predicirse baseándose na complementariedade da secuencia entre os supostos ARN diana e os elementos antisentido ou bucles de recoñecemento na secuencia dos snoRNA. Porén, hai un crecente número de snoRNA guías "orfos" para os que non se coñece ningún ARN diana, o cal suxire que podería haber máis proteínas ou transcritos implicados no procesamento do ARNr cós que previamente se pensaba e/ou que algúns snoRNA teñen outras funcións que non teñen que ver co ARNr.[13][14] Hai probas de que algúns destes snoRNA orfos regulan transcritos de splicing alternativo.[15] Por exemplo, parece que o snoRNA de caixa C/D SNORD115, regula o splicing alternativo do ARNm do receptor 2C da serotonina por medio dunha rexión conservada complementaria.[16][17] Para outro snoRNA de caixa C/D, o SNORD116, que se encontra no mesmo clúster ca SNORD115, predicíronse 23 posibles dianas nos xenes codificadores de proteínas usando un método bioinformático. Destes, unha gran proporción viuse que sufrían splicing alternativo, o que suxire un papel do SNORD116 na regulación do splicing alternativo.[18]

Modificacións da diana

O efecto preciso das modificacións de metilación e pseudouridilación na función dos ARN maduros non se coñece aínda. As modificacións non parecen ser esenciais pero sábese que incrementan sutilmente o pregamento do ARN e a interacción con proteínas ribosómicas. Apoia a súa importancia o feito de que as modificacións dos sitios diana están exclusivamente localizados nos dominios conservados e funcionalmente importantes do ARN maduro e están normalmente conservados en especies eucariotas moi afastadas na árbore evolutiva.[3]

  1. A ribosa con metilación 2'-O causa un incremento na conformación 3'-endo.
  2. A pseudouridina (psi/Ψ) engade outra opción para a unión a H.
  3. O ARN moi metilado está protexido da hidrólise. O ARNr actúa como un ribozima catalizando a súa propia hidrólise e splicing.

Organización xenómica

A maioría dos xenes de snoRNA de vertebrados están codificados nos intróns de proteínas implicadas na síntese do ribosoma ou tradución, e son sintetizados pola ARN polimerase II, pero os snoRNA tamén poden ser transcritos a partir dos seus propios promotores polas ARN polimerases II ou III.

Loci impresos

No xenoma humano hai polo menos dous exemplos de snoRNA de caixa C/D que foron atopados en repeticións en tándem dentro de loci impresos (imprinted loci). Estes dous loci (14q32 no cromosoma 14 e 15q11q13 no cromosoma 15) foron extensivamente caracterizados e en ambas as rexións foron atopados múltiples snoRNA situados dentro de intróns en agrupacións de copias estreitamente relacionadas.

En 15q11q13, foron identificados cinco snoRNA: SNORD64, SNORD107, SNORD108, SNORD109 (dúas copias), SNORD116 (29 copias) e SNORD115 (48 copias). A perda das 29 copias de SNORD116 desta rexión é a causa da síndrome de Prader-Willi[19][20][21][22] e a ganancia de copias adicionais de SNORD115 foi asociada co autismo.[23][24] [25]

A rexión 14q32 contén repeticións de dous snoRNAs: SNORD113 (9 copias) e SNORD114 (31 copias) dentro de intróns dun transcrito de ARN non codificante específico de tecido (MEG8). O dominio 14q32 comparte características xenéticas co loci impreso 15q11-q13 e foi suxerida unha posible función para as repeticións en tándem de snoRNA de caixa C/D na evolución ou no mecanismo de loci impresos.[26]

Outras funcións dos snoRNA

Os snoRNA poden funcionar como microARN. Demostrouse que o ARN ACA45 humano é un snoRNA que pode ser procesdo nun microARN maduro de 21 nucleótidos de longo por unha endonuclease Dicer da familia da RNase III.[27] Este produto snoRNA fora previamente identificado como mmu-miR-1839 Arquivado 28 de xullo de 2011 en Wayback Machine. e demostrouse que era procesado independente da endorribonuclease Drosha que xera os outros microARN.[28] Análises bioinformáticos revelaron que fragmentos similares a microARN supostamente derivados de snoRNA están presentes en diversos organismos.[29]

Recentemente, descubriuse que os snoRNA poden ter funcións non relacionadas co ARNr. Unha desas funcións é a regulación do splicing alternativo do transcrito transxene, realizado polo snoRNA HBII-52, tamén coñecido por SNORD115.[30]

Outro recente descubrimento tamén mostra a existencia de características de snoRNA, microARN e piRNA nun novo ARN non codificante, o ARN non codificante x (x-ncRNA) e a súa implicación biolóxica no Homo sapiens.[31]

Notas

Véxase tamén

Ligazóns externas