Niekodujący nie znaczy bezużyteczny – mit śmieciowego DNA

Emilia Korczmar 30 gru, 6 minut czytania

 

Najdłuższa powieść na świecie, „W poszukiwaniu straconego czasu” Marcela Prousta, liczy 9 609 000 znaków. Jest to imponująca liczba, lecz odpowiada zaledwie ułamkowi ludzkiego genomu, którego wielkość wynosi ponad 6 miliardów par zasad. Trudno sobie wyobrazić książkę o tak pokaźnej zawartości. Tymczasem informacja genetyczna człowieka zawarta jest w jądrze komórkowym o średnicy kilku mikrometrów. Rozwój technik biologii molekularnej umożliwił poznanie sekwencji DNA oraz analizę funkcji poszczególnych genów. W efekcie wykazano, iż geny kodujące białko stanowią jedynie około 2% ludzkiego genomu. Przez dekady wierzono, iż pozostała część nie pełni istotnej funkcjonalnej roli w organizmie, zdobywając niechlubne imię śmieciowego DNA (ang. junk DNA). Dziś wiemy, że niesłusznie.

Początki tego zagadnienia sięgają lat 60 XX wieku, lecz termin śmieciowy DNA ten został ukuty w 1972 roku przez japońsko-amerykańskiego genetyka Susumu Ohno, który twierdził, iż większość niekodującego DNA jest efektem duplikacji genów, będącej istotnym mechanizmem ewolucji genomów [1, 2]. Według Susumu Ohno, gdy gen ulega podwojeniu, jedna kopia utrzymuje dawną funkcję, podczas gdy druga podlega mutacjom, prowadzącym niekiedy do wykształcenia nowych funkcji. Jednak w większości przypadków dodatkowa kopia traci funkcjonalność, stając się pseudogenem. Elementy genomu powstałe w wyniku duplikacji zostały nazwane śmieciowym DNA, choć w krótkim czasie termin ten zaczął obejmować cały niekodujący DNA. Wraz z odkryciami dotyczącymi niekodujących RNA, o których więcej pisaliśmy tutaj [https://genetyka.bio/tajemnice-rna-czyli-kilka-slow-o-niekodujacych-czasteczkach/], pogląd śmieciowego DNA zaczął chwiać się w posadach, by w 2012 roku kompletnie upaść. To właśnie wtedy naukowcy w ramach projektu ENCODE (ang. Encyclopedia of DNA Elements) opublikowali wyniki wieloletnich badań, dowodzące iż około 80% ludzkiego genomu to sekwencje o określonych funkcjach biologicznych [3].

Poznanie sekwencji genomu człowieka na początku XXI wieku otworzyło nowy rozdział w historii genetyki i biologii molekularnej. Jednak sama sekwencja, będąca zbiorem miliardów liter A, T, C i G, nie mówiła nam jeszcze nic. Kolejne lata badań pozwoliły określić poszczególne regiony w sekwencji genomu człowieka. Słysząc „genom” pierwszym skojarzeniem jest najczęściej DNA kodujący informacje na temat sekwencji aminokwasowej białka. Jednak znacznie większą część genomu tworzą:

  • Transpozony – sekwencje ruchome, nazywane skaczącymi genami (ang. jumping genes), gdyż mogą przemieszczać się w obrębie genomu. Stanowią one około połowę genomu człowieka, a u roślin nawet 90%. Wśród transpozonów wyróżniamy retrotranspozony, które wykorzystują mechanizm transkrypcji na RNA, a następnie przepisania na DNA w reakcji odwrotnej transkrypcji. Powielona w ten sposób kopia retrotranspozonu może „wkleić się” w inne miejsce genomu. Mechanizm przemieszczania się zależy od obecności długich powtórzeń na końcach sekwencji, na podstawie których wyróżniamy retrotranspozony LTR (ang. long terminal repeats) oraz non-LTR. Retrotranspozony występujące pomiędzy genami to najczęściej długie, przeplatane elementy jądrowe – LINE (ang. long interspersed nuclear elements), natomiast w regionach bogatych w geny częściej występują krótkie odpowiedniki – SINE (ang. short interspersed nuclear elements). Ze względu na zdolność powielania i wędrowania w obrębie genomu transpozony są nazywane również „pasożytami genomowymi” [4]. Wykazano udział ruchomych elementów genomu w powstawaniu m.in. dystrofii mięśniowej oraz chorób nowotworowych [5]. Na szczęście nie wszystkie skutki aktywności transpozonów są szkodliwe. Niekiedy włączenie sekwencji transpozonu w obrębie genu prowadzi do powstania nowego, funkcjonalnego białka. Mechanizm ten jest niezwykle istotny, co widać szczególnie na przykładzie układu immunologicznego, gdyż jesteśmy w stanie wytworzyć bardzo różnorodne przeciwciała, skierowane przeciwko dowolnemu antygenowi [6].

 

  • Powtórzenia tandemowe – szeregi powtórzeń nukleotydowych, pełniące istotną rolę w utrzymaniu integralności genomu. Wśród nich wyróżniamy DNA satelitarny, minisatelitarny oraz mikrosatelitarny, różniące się rozmiarem sekwencji oraz liczbą powtarzających się zasad. Sekwencje powtórzone tandemowo budują centromer – pierwotne przewężenie chromosomu. Ponieważ w trakcie podziału komórki centromer pęka w celu rozdzielenia ramion chromosomu, istotnym jest aby sekwencja DNA centromeru nie kodowała białka, gdyż funkcja ta mogłaby zostać utracona w trakcie podziału. Z tego samego powodu powtórzenia tandemowe występują również na zakończeniach chromosomów – telomerach. Struktury te ulegają skróceniu po każdym podziale komórki, aż do osiągnięcia krytycznej długości, po której komórka umiera. Gdyby na końcach chromosomów znajdowały się sekwencje kodujące białko, z każdym podziałem komórki tracilibyśmy ich część, co wiązałoby się z poważnymi konsekwencjami dla organizmu [7].

 

  • Introny – fragmenty niekodującego DNA, które rozdzielają eksony – elementy kodujące białko. Dzięki intronom informacja genetyczna w komórkach eukariotycznych może być odczytywana na różne sposoby. Po przepisaniu DNA na pre-mRNA introny zostają wycinane, zaś końce eksonów są łączone ze sobą w różnych konfiguracjach. Proces ten nazywamy alternatywnym splicingiem. W efekcie ten sam fragment DNA może być źródłem szeregu różnych białek.

 

  • Pseudogeny – sekwencje przypominające geny, lecz niekodujące białka. Część z nich powstaje na drodze odwrotnej transkrypcji, podobnie jak wymienione powyżej retrotranspozony. Pseudogeny mogą powstawać również w wyniku duplikacji funkcjonalnych genów, a następnie mutacji prowadzących do utraty funkcji. Sekwencje pseudogenów przez lata były uznawane za bezużyteczne relikty ewolucji, jednak okazuje się, iż nie wszystkie z nich są pozbawione funkcji. Niektóre pseudogeny ulegają transkrypcji, prowadząc do powstania regulatorowych RNA. Jednak brak transkrypcji pozostałych pseudogenów nie wyklucza ich funkcjonalności. Dowiedziono, iż pseudogeny mają wpływ na strukturę chromatyny, co przekłada się na regulację ekspresji genów kodujących białka [8]. Co więcej, ekspresja niektórych pseudogenów jest powiązana z chorobami nowotworowymi, m.in. w przypadku raka piersi i tarczycy [9].

 

 

Rysunek 1. Składanie mRNA (splicing). [Źródło: khanacademy.org]

 

  • Rysunek 2. Kompozycja genomu człowieka [Źródło: ilustracja własna]

 

Choć jedynie 2% ludzkiego genomu to sekwencje kodujące białko, nie są to jedyne regiony ulegające transkrypcji. Około 70% genomu jest źródłem niekodujących RNA (non-coding RNA, ncRNA), posiadających wiele różnorodnych funkcji. Część z nich bezpośrednio uczestniczy w biosyntezie białka, dostarczając właściwe aminokwasy (transfer RNA, tRNA) oraz tworząc „rusztowanie” maszynerii translacyjnej (ribosomal RNA, rRNA). Mały jądrowy RNA (small nuclear RNA, snRNA) reguluje proces splicingu podczas dojrzewania mRNA, natomiast mały jąderkowy RNA (small nucleolar RNA, snoRNA) jest zaangażowany w modyfikację rRNA i tRNA. Większość snRNA pochodzi z intronów wycinanych w trakcie splicingu, co jest świetnym przykładem tego, iż w genomie nic się nie marnuje. Liczną grupę niekodujących RNA stanowią cząsteczki regulatorowe, takie jak mikroRNA (miRNA) oraz małe interferujące RNA (small interfering RNA, siRNA), pełniące istotną rolę w kontroli ekspresji genów. Przyłączają się one do komplementarnych mRNA, prowadząc do ich degradacji lub zahamowania procesu translacji, czego konsekwencją jest obniżenie poziomu białka. U człowieka zidentyfikowano ponad 2000 mikroRNA. Ponieważ każdy z nich reguluje ekspresję setek genów, skala działania tych krótkich niekodujących RNA jest ogromna. Źródłem miRNA i siRNA są przede wszystkim sekwencje intronów, co ponownie dowodzi istotności tych regionów DNA. Choć rola wielu niekodujących RNA wciąż wymaga odkrycia, dotychczasowe badania dowodzą, iż wiele spośród ncRNA uczestniczy w kluczowych procesach komórkowych, jak również w rozwoju różnorodnych chorób, m.in. nowotworów [10].

Historia junk DNA jest dobitnym przykładem, iż paradygmaty mogą mieć negatywny wpływ na rozwój nauki. Ponieważ przez lata koncepcja śmieciowego DNA była powszechnie uznawana, techniki analizy genomów koncentrowały się na badaniu funkcjonalnych genów. Określenie „śmieciowy” w istocie zniechęca do badania funkcji. Dlatego też analizy niekodującego DNA były dodatkowo utrudnione, ze względu na węższy zakres opracowanych metod, w porównaniu do technik analizy kodującego DNA. Dziś, dzięki nowoczesnym technologiom badania genomu i transkryptomu, w końcu możemy analizować sekwencje DNA i RNA, które przez długi czas były uważane za zbędne.

 


Fakty i Mity Genetyki tworzone są przez pasjonatów, specjalistów w swoich dziedzinach.
Ten artykuł czytasz za darmo, bez reklam, bez spamu. Doceń naszą pracę i postaw nam wirtualną kawę 🙂
Dziękujemy! – Wasza Redakcja FiMG

Postaw mi kawę na buycoffee.to


 

Bibliografia:

[1] Palazzo, A. F., & Gregory, T. R. (2014). The case for junk DNA. PLoS genetics10(5), e1004351. https://doi.org/10.1371/journal.pgen.1004351

[2] Ohno S. (1972). So much “junk” DNA in our genome. Brookhaven symposia in biology23, 366–370.

[3] ENCODE Project Consortium (2012). An integrated encyclopedia of DNA elements in the human genome. Nature489(7414), 57–74. https://doi.org/10.1038/nature11247

[4] Orgel, L., Crick, F. Selfish DNA: the ultimate parasite. Nature 284, 604–607 (1980). https://doi.org/10.1038/284604a0

[5] Payer, L.M., Burns, K.H. Transposable elements in human genetic disease. Nat Rev Genet 20, 760–772 (2019). https://doi.org/10.1038/s41576-019-0165-8

[6] Market, E., & Papavasiliou, F. N. (2003). V(D)J recombination and the evolution of the adaptive immune system. PLoS biology1(1), E16. https://doi.org/10.1371/journal.pbio.0000016

[7] Hemann, M. T., Strong, M. A., Hao, L. Y., & Greider, C. W. (2001). The shortest telomere, not average telomere length, is critical for cell viability and chromosome stability. Cell107(1), 67–77. https://doi.org/10.1016/s0092-8674(01)00504-9

[8] Cheetham, S.W., Faulkner, G.J. & Dinger, M.E. Overcoming challenges and dogmas to understand the functions of pseudogenes. Nat Rev Genet 21, 191–201 (2020). https://doi.org/10.1038/s41576-019-0196-1

[9] Roberts, T. C., & Morris, K. V. (2013). Not so pseudo anymore: pseudogenes as therapeutic targets. Pharmacogenomics14(16), 2023–2034. https://doi.org/10.2217/pgs.13.172

[10] Zhang, P., Wu, W., Chen, Q., & Chen, M. (2019). Non-Coding RNAs and their Integrated Networks. Journal of integrative bioinformatics16(3), 20190027. https://doi.org/10.1515/jib-2019-0027

 


Fakty i Mity Genetyki tworzone są przez pasjonatów, specjalistów w swoich dziedzinach.
Ten artykuł czytasz za darmo, bez reklam, bez spamu. Doceń naszą pracę i postaw nam wirtualną kawę 🙂
Dziękujemy! – Wasza Redakcja FiMG

Postaw mi kawę na buycoffee.to


 

Podziel się: