/

Sekwencjonowanie całego genomu

Gabriela Zając
Gabriela Zając 14 sty, 7 minut czytania
WGS whole genome sequencing

Sekwencjonowanie całego genomu (ang. whole genome sequencing; WGS) to metoda badawcza, a teraz również i diagnostyczna, pozwalająca na odczytanie wszystkich liter DNA, które są obecne w każdej z naszych komórek. WGS rozpoczęło nową erę medycyny personalizowanej. Za pomocą sekwencjonowania całego genomu człowieka, każdy gen można przekształcić w dane cyfrowe do analizy, w efekcie otrzymując taki obraz.

Wykres sekwencjonowanie genomu
Źródło: https://medium.com/@tiffanysouterre/dna-sequencing-techniques-explained-53c21eef51b1

Warto wspomnieć, że wszystkie regiony kodujące białka stanowią zaledwie nieco ponad 1% całego genomu. Regiony te, wszystkie razem, zwane są inaczej eksomem, a badanie ich nazywane jest sekwencjonowaniem całego eksomu (ang. Whole Exome Sequencing; WES).

WGS whole genome sequencing, sekwencjonowanie całego genomu

Technika WGS wymaga zsekwencjonowania nie tylko całego jądrowego DNA organizmu, ale także mitochondrialnego DNA (mtDNA). Jądrowy DNA, to ten, który tworzy nasze 46 chromosomów. Kompletny zestaw chromosomów zawarty w jednej komórce zwany jest kariotypem (na obrazku poniżej widoczny jest kariotyp zdrowego człowieka). Liczba chromosomów jest unikatowa dla osobników danego gatunku. Dla przykładu, kariotyp psa liczy 78 chromosomów, a szympansa – 48.

Mitochondrialny DNA ma postać dwuniciową zamkniętą i przedstawiony jest na schemacie po prawej stronie. Na jedno mitochondrium przypada 4-10 cząsteczek DNA, a każda z nich koduje 37 genów. Co istotne, mtDNA charakteryzuje się zróżnicowaniem. Mitochondria zlokalizowane w tej samej komórce mogą zawierać różniące się od siebie mtDNA, co więcej, różnice te mogą występować nawet w pojedynczym mitochondrium. Zjawisko to nazywane jest heteroplazmią i może się pojawić, na przykład, w wyniku mutacji. Wystąpienie mutacji w genach mitochondrialnych wiąże się z poważnymi chorobami genetycznymi, a zróżnicowanie mtDNA może nasilać ich objawy.

Źródło: https://www.ncbi.nlm.nih.gov/pmc/articles/PMC5609194/
Źródło: https://www.ncbi.nlm.nih.gov/pmc/articles/PMC6697116/

Schemat ten przedstawia, co prawda postać kolistą, jednak mtDNA rzadko, jeśli nie wcale, przyjmuje taką postać. Rycina poniżej przedstawia, jak mtDNA wygląda w rzeczywistości.

Już w latach 70 i 80 ubiegłego wieku stosowano metody sekwencjonowania DNA, a mianowicie sekwencjonowanie Maxama-Gilberta oraz sekwencjonowanie Sangera. Jednak dopiero w latach 90 XX w. metody te rozwinęły się do tego stopnia, że wreszcie można było sekwencjonować całe genomy. I takim pierwszym organizmem, poddanym wielkiej próbie, był nicień Caenorhabditis elegans, którego genom zsekwencjonowano w 1998 roku.

Źródło: https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3302602/

W roku 1999 zsekwencjonowano całą sekwencję chromosomu 22 człowieka, aż wreszcie po 5 latach badacze ogłosili, iż zsekwencjonowali około 99% całego genomu człowieka. Całe to przedsięwzięcie nazwano Projektem Poznania Ludzkiego Genomu (ang. Human Genome Project; HGP). Dzięki temu projektowi nastąpił olbrzymi postęp w rozwoju medycyny oraz biotechnologii. Sekwencjonowanie całego genomu pozwala badaczom analizować nie tylko geny kodujące istotne białka, ale także regiony naszego DNA, pełniące inne ważne funkcje, takie jak regulacja naszych genów. Ponadto, nastąpił rozwój w dziedzinie biologii ewolucyjnej. Badacze, dzięki znajomości poszczególnych genów, mogą prześledzić drogi ewolucyjne przedstawicieli różnych gromad, np. gadów i płazów. Zaskakującym jest, iż uzyskać można materiał genetyczny do pełnego sekwencjonowania genomu nawet z „antycznego” DNA (ang. ancient DNA; aDNA), czyli takiego, który pochodzi od martwych od dawna organizmów.

Za pomocą WGS badacze są w stanie ustalić występowanie mutacji w intronach, które mogą niekorzystnie wpłynąć na przebieg splicingu (wyjaśnienie poniżej). Z kolei mutacje w regionach 5’UTR i promotorowych mogą zmieniać aktywność transkrypcyjną. Mutacje w elementach regulatorowych, takich jak wzmacniacz i wyciszacz (ang. enhancer and silencer) również mogą wpływać na aktywność transkrypcyjną, a dodatkowo na strukturę chromatyny. Mutacje w regionach 3’UTR mogą mieć niekorzystny wpływ na stabilność powstałego RNA oraz na translację białka. Rysunek poniżej przedstawia budowę genu, w skład którego wchodzą wszystkie wyżej wymienione rodzaje sekwencji (kolor żółty: eksony; kolor szary: introny).

Źródło: rysunek własny

Przebieg procedury WGS:

  1. Pobranie próbki 2 – 10 ml krwi zawieszonej w EDTA (zapobiega pozaustrojowemu krzepnięciu krwi) oraz izolacja DNA z krwi pacjenta
  2. Pocięcie DNA na krótkie fragmenty o znanej długości za pomocą „molekularnych nożyczek”, czyli enzymów restrykcyjnych
  3. Przygotowanie biblioteki DNA za pomocą reakcji PCR, pozwalającej na utworzenie wielu kopii fragmentów DNA
  4. Sekwencjonowanie DNA – odczytywanie poszczególnych liter DNA z każdego pojedynczego fragmentu
  5. Analiza DNA – składanie w całość pociętych fragmentów za pomocą programu komputerowego oraz interpretacja otrzymanego wyniku przez specjalistów

Sekwencjonowanie całego eksomu trio (trio-WES) lub całego genomu trio (trio-WGS) jest powszechnie stosowane do analizy sekwencji całego eksomu dziecka i jego rodziców lub innych członków rodziny. Takie podejście znacznie ułatwia wykrycie mutacji de novo, leżących u podstaw sporadycznych przypadków różnych zaburzeń genetycznych. Analiza trio może być wykorzystywana do identyfikacji molekularnych podstaw zaburzeń genetycznych u osób:

  • które wyczerpały inne obecnie dostępne opcje badań genetycznych;
  • które posiadają długą listę niesprecyzowanych diagnoz;
  • z heterogenną postacią choroby, gdyż jej patogeneza może leżeć u podstaw różnych genów;
  • z nietypową postacią zaburzeń genetycznych

Korzyści płynących z analizy całego genomu jest zdecydowanie więcej. Badanie to pozwala z łatwością ustalić, czy u danej osoby występują choroby genetyczne, takie jak na przykład mukowiscydoza czy anemia sierpowata. Większość pacjentów z dziedzicznymi rzadkimi chorobami nie otrzymuje diagnozy. Około połowy takich zaburzeń związanych jest z wciąż nieodkrytymi genami, zaangażowanymi w daną jednostkę chorobową. Wprowadzenie WGS do systemu opieki zdrowotnej usprawniłoby proces postawienia diagnozy pacjentowi.

WGS są też niezwykle przydatne w leczeniu chorób nowotworowych. Nowotwór jest zasadniczo chorobą genomu, która ewoluuje i postępuje wraz z nagromadzeniem się mutacji somatycznych. Wraz z rozwojem technologicznym techniki WGS pozwalają na zbadanie wszystkich zmian genomowych w nowotworach, co w efekcie wspomaga ustalanie spersonalizowanych terapii przeciwnowotworowych nie tylko dla tych powszechniej występujących nowotworów, np. raka jelita grubego, czy czerniaka, ale również tych bardzo rzadkich. Co istotne, w podatności na poważne choroby niekoniecznie główną rolę odgrywają geny. Powszechne choroby w przeważającej mierze mogą być determinowane przez styl życia (np. dietę, aktywność fizyczną), środowisko, jak i inne czynniki niegenetyczne. Objawy wielu z tych chorób można wyeliminować dzięki zmianom złych nawyków. Co oznacza, iż wiedza o ludzkim genomie nie przybliży nas do rozwiązania wszystkich zagadek o chorobach ani nie sprawi, że magicznie choroby znikną z naszego życia, jeśli my sami nie będziemy aktywnie im przeciwdziałać.

Objaśnienia

Transkrypcja to proces przepisywania informacji zawartej w DNA na RNA za pomocą enzymu: polimerazy RNA II. Jest to bardzo ważne zjawisko, któremu podlega odcinek DNA od sekwencji promotorowej do sekwencji terminalnej. Ale to nie wszystko, otóż proces transkrypcji podlega różnym opcjom „wspomagania”. Jedną z nich jest, wyżej już wspomniany, enhancer – wzmacniacz transkrypcji. Zwykle jest on położony w odległości około 1 miliona par zasad od sekwencji promotorowej. Enhancer nabiera mocy po przyłączeniu się czynnika transkrypcyjnego, który odpowiednio reguluje proces transkrypcji. Z kolei silencer – wyciszacz transkrypcji – ma działanie odwrotne do wzmacniacza i wpływa negatywnie na transkrypcję (hamuje ją). Oba zjawiska przedstawiają ryciny poniżej.

Źródło: https://www.ncbi.nlm.nih.gov/pubmed/29893792

Świeżo transkrybowany fragment RNA zwany jest pre-mRNA i wymaga jeszcze obróbki, by stać się pełnoprawnym mRNA (ang. messenger RNA). Dzieje się to podczas splicingu – procesu zachodzącego po transkrypcji, podczas którego usuwane są introny, czyli sekwencje niekodujące, znajdujące się między eksonami – sekwencjami zawierającymi informację genetyczną. W efekcie eksony mogą zostać złożone razem podczas alternatywnego splicingu. Dawno temu uważano, że jeden gen odpowiada jednemu rodzajowi mRNA, czyli jednemu białku. Dziś już wiadomo, że każdy gen odczytywany jest w kawałkach, które następnie mogą być składane w rozmaitych kombinacjach, niekoniecznie po kolei, a do tego jeszcze z pominięciem niektórym eksonów. Efektem jest otrzymywanie bardzo wielu różnych białek kodowanych przez ten sam gen. A białka te, pomimo strukturalnych podobieństw, często mogą mieć różne funkcje w tkankach i komórkach.

Źródło: https://www.researchgate.net/publication/269220283_Computational_and_Functional_Analyses_of_Splicing_Regulation_ISBN_9781243859365

Naukowcy oszacowali, że około 70% naszych genów koduje co najmniej 4 białka, a najwięcej kombinacji alternatywnego splicingu obserwuje się w genach, które są wysokoaktywne w złożonych tkankach o różnych typach komórek, takich jak mózg. Liczne kombinacje występują również w genach komórek układu odpornościowego. A za największych „rekordzistów” w tej dziedzinie uznać można immunoglobuliny. DNA odpowiedzialny za ich kodowanie tworzy trzy niezwiązane ze sobą skupiska genów. Każde z tych skupisk występuje na odrębnym chromosomie (chromosomy 2, 14 i 22), a w obrębie każdego z tych skupisk genów występuje wiele sekwencji kodujących, które rekombinują na poziomie DNA. W skład skupiska genów każdego łańcucha lekkiego (L) wchodzi wiele różnych wariantów genów V i J, natomiast w przypadku łańcucha ciężkiego (H) są to różne warianty genów V, D i J. Podczas rozwoju limfocytu B (komórki układu odpornościowego odpowiedzialnej za wytwarzanie przeciwciał) dochodzi do losowej selekcji ze skupiska genów łańcucha ciężkiego po jednym genie V, D i J oraz, analogicznie, ze skupiska genów łańcucha lekkiego dwa geny V i J . Jest to bardzo nietypowe zjawisko, gdyż prowadzi do powstania zupełnie nowych genów, a ponieważ proces ten przebiega w ogromnej liczbie komórek, to wynikiem tego jest wytworzenie milionów przeciwciał o różnej specyficzności. Możliwe jest ponad 15 000 000 różnorodnych kombinacji, a nieprecyzyjność tego procesu i mutacje znacznie przyczyniają się do zwiększenia tej zmienności aż do miliardów możliwych połączeń.

Źródło: https://www.ncbi.nlm.nih.gov/pmc/articles/PMC5089068/

Na rycinie powyżej przedstawiony jest schemat rekombinacji oraz składania genu V(D)J. Złożenie pełnej sekwencji kodującej odbywa się w dwóch etapach. Na początku, geny D i J są wybierane spośród kilku możliwości i łączone. Następnie wybierany jest gen V i łączony z genami D-J, tworząc funkcjonalny ekson. W przypadku genów łańcucha L proces ten odbywa się podczas jednego etapu i następuje w wyniku rekombinacji i złożenia genów V i J.

Literatura:

  1. Fernandes-Marmiesse A., Gouveia S., Couce M.L., “NGS Technologies as a Turning Point in Rare Disease Research, Diagnostis and Treatment”, Curr Med Chem., 2018; 25(3): 404-432.
  2. Fresard L., Montgomery S.B., “Diagnosing rare diseases after the exome”, Cold Spring Harb Mol Case Stud, 2018; 4(6).
  3. Nakagawa H., Fujita M., “Whole genome sequencing analysis for cancer genomics and precision medicine”, Cancer Sci, 2018; 109(3): 513-522.
  4. Ng P.C., Kirkness E.F., “Whole genome sequencing”, Methods Mol Biol, 2010; 628:215-226.
  5. Zi-Bing J., Zhongshan L., Zhenwei L., Yi J., Xue-Bi C., Jinyu W., “Identification of de novo germline mutations and causal genes for sporadic diseases using trio-based whole-exome/genome sequencing”, Biological Reviews, 2018; 93(2): 1014-1031.
  6. Schon E.A., DiMauro S., Hirano M., “Human mitochondrial DNA: roles of inherited and somatic mutations”, Nat Rev Genet, 2012; 13(12): 878-890.
  7. McManus C.J., Graveley B.R., “RNA structure and the mechanisms of alternative splicing”, Curr Opin Genet Dev, 2011; 21(4): 373-379.
  8. Wang Y., Liu J., Huang B., Xu YM., Li J., Huang LF., Lin J., Zhang J., Min QH., Yang WM., Wang XZ., “Mechanism of alternative splicing and its regulation”, Biomed Rep, 2015, 3(2): 152-158.
  9. Jung D., Giallourakis C., Mostoslavsky R., Alt FW., “Mechanism and control of V(D)J recombination at the immunoglobulin heavy chain locus”, Annu Rev Immunol, 2006, 24:541-570.
Podziel się: