/

O sekwencjonowaniu słów kilka

Magda Kopczyńska
Magda Kopczyńska 9 sty, 7 minut czytania

Pojęcie sekwencjonowania coraz częściej pojawia się w kontekście (nie tylko) naukowym. Jednak wiedza na ten temat często nie jest łatwa do przyswojenia, skomplikowana terminologia miesza się tu z abstrakcyjnymi mechanizmami, a całość dla osoby niezwiązanej z genetyką czy biotechnologią składa się na dość chaotyczny obraz. Czym więc jest sekwencjonowanie DNA, kiedy i kto wpadł na ten pomysł i w czym ta technologia może nam pomóc?

Poprawna kolejność liter

W większości komórek naszego organizmu znajduje się jądro komórkowe, które pełni funkcję podobną do centrum dowodzenia. Ta nadrzędna rola jest mu przypisana dzięki obecności 46 chromosomów – struktur zbudowanych z mocno skompresowanego DNA.

DNA z kolei to długa dwuniciowa cząsteczka, której pojedycznym elementem budulcowym jest tzw. nukleotyd. Schodząc w hierarchii struktury jeszcze niżej, na jeden nukleotyd składają się trzy podstawowe elementy: deoksyryboza, reszta kwasu fosforowego i zasada azotowa. Te dwa pierwsze są odpowiedzialne za utworzenie szkieletu DNA, a ostatni determinuje zapisaną tam informację. Pojedynczą nić można porównać do ciągu liter w zeszycie – deoksyryboza wraz z resztą kwasu fosforowego to linia, na której znajdują się litery, czyli zasady azotowe. Litery w alfabecie DNA są jednak tylko cztery: A, C, T, G – każda reprezentuje inną zasadę azotową. Takie dwie nici, łącząc się ze sobą w określony sposób tworzą pełną cząsteczkę DNA.

W utrzymaniu tej struktury, istotny jest fakt, że poszczególne zasady azotowe łączą się ze sobą za pomocą wiązań wodorowych, zawsze w określony sposób: A połączy się z T (zawsze podwójne wiązanie wodorowe), a C z G (zawsze potrójne wiązanie wodorowe). Jednak nie tylko ten rodzaj wiązań odpowiedzialny jest za charakterystyczny kształt DNA – dowiedziono ostatnio, że to głównie środowisko wodne utrzymuje cząsteczkę w takiej formie.

Budowa podwójnej nici DNa
Rys. 1 Budowa podwójnej nici DNA. Szkielet jest zbudowany dzięki połączeniu wielu cząsteczek cukru – deoksyrybozy za pomocą reszt kwasu fosforowego. Litery oznaczają zasady azotowe, kolejno: A – adeninę, T – tyminę, C – cytozynę, G – guaninę.
Źródło: https://epodreczniki.pl/a/dna—nosnik-informacji-genetycznej/D18yvChME

Wyobraźmy sobie, że rozplatamy te dwie nici i odczytujemy kolejno poszczególne litery – to właśnie jest istotą tajemniczego sekwencjonowania. Do czego może być nam potrzebna ta wiedza? DNA jest nośnikiem ogromnej ilości informacji. Każda trójka nukleotydów koduje jeden aminokwas , z aminokwasów z kolei składają się białka , czyli elementy kluczowe dla funkcjonowania każdego procesu w naszym organizmie. Znając zatem dokładną kolejność liter, można dość precyzyjnie określić budowę białka oraz, w przypadku choroby, stwierdzić, gdzie dane białko może być uszkodzone. Co ciekawe – regiony, które rzeczywiście kodują konkretną informację o budowie białek stanowią tylko około 1% całości naszego DNA!

Nieznany szyfr

Nie trudno się domyślić, że kwestia dokładnej budowy cząsteczki DNA nurtowała naukowców od dawna. W 1955 roku Frederick Sanger odczytał dokładną sekwencję aminokwasów budujących insulinę , co dostarczyło niezbitego dowodu na to, że białka budowane są na podstawie określonego wzoru molekularnego, kodu, a nie dzięki przypadkowym oddziaływaniom substancji rozpuszczonych w komórkach. Już w 1970 roku Ray Wu zaproponował kompletną metodę poznania kolejności nukleotydów w DNA, a 7 lat później Sangerowi udało się ją wykorzystać, żeby ten proces znacznie przyspieszyć. Metoda Sangera do dziś używana jest w wielu laboratoriach na przykład w celu potwierdzenia wyników sekwencjonowania uzyskanychinnymi metodami. Nowoczesne techniki sekwencjonowania są bardzo dokładne, ale wciąż wykonujemy analizy potwierdzające, aby mieć pewność, że wynik, który otrzymuje pacjent, jest poprawny.

W 10 lat od wprowadzenia metody dwie firmy – Apllied Biosystems oraz Amersham–Pharmacia zaprezentowały urządzenia, w których sekwencjonowanie odbywało się automatycznie. Były w stanie odczytać około 1000 nukleotydów dziennie. W latach 80-tych sekwencjonowanie małych genomów wielkości kilkunastu tysięcy nukleotydów, jak np. wirusów, stało się stosunkowo proste. Jednak nadal problem stanowiły do rozszyfrowania genomy duże. Naukowcy za punkt honoru obrali sobie zsekwencjonowanie genomu człowieka – aż 3.2 miliardów liter. Było to w tamtych czasach ogromne przedsięwzięcie m.in. dlatego, że zaproponowane metody były niezwykle czasochłonne i kosztowne. W 1990 roku rozpoczęto pracę nad międzynarodowym Projektem Poznania Genomu Człowieka (ang. Human Genome Project), który trwał blisko 13 lat i pochłonął zasoby finansowe rzędu 3 miliardów $. Dla porównania, na dzień dzisiejszy koszt sekwencjonowania genomu oscyluje w granicach – jedynie – 1000$, a sama analiza laboratoryjna trwa zaledwie kilka dni.

Istnieje wiele różnych metod sekwencjonowania, omówimy je szczegółowo wkrótce, a kilka przykładów przedstawia poniższa tabela:

NazwaWynalazcaGeneracja / Rok wprowadzeniaDla ciekawych
Sekwencjonowanie metodą terminacji łańcuchaFrederick SangerI generacja / 1977link
Sekwencjonowanie z wykorzystaniem chemicznej degradacji DNAAllan Maxam i Walter GilbertI generacja / 1977-1980link
PirosekwencjonowaniePal Nyren i Mostafa RonaghiI generacja / 1996 (wiele współczesnych metod bazuje na tej metodzie)link 1

link 2

IlluminaShankar Balasubramanian i David KlenermanNGS (ang. Next Generaion Sequencing, Sekwencjonowanie Nowej Generacji) / 2005link
Oxford NanoporeNaukowcy z Uniwersytetu HarvardaNGS / 2012link

Głównymi zaletami nowoczesnych technik są przede wszystkim znacznie niższy koszt analizy dla jednej próbki oraz możliwość analizowania wielu sekwencji jednocześnie – daje to sposobność do analizowania bardzo dużej ilości danych w stosunkowo krótkim czasie.

Illumina, czyli nowoczesne sekwencjonowanie poprzez syntezę

Obecnie najpowszechniejszą i stosowaną na największą skalę techniką sekwencjonowania jest technologia wykorzystywana przez firmę Illumina. Zarys technologii bardzo dobrze przedstawia poniższy film:

Cały proces dzieli się na trzy etapy: amplifikację (czyli powielenie), właściwe sekwencjonowanie oraz analizę. Zanim się jednak rozpocznie, materiał, który chcemy przeanalizować, musi zostać pocięty na małe fragmenty. W zależności od tego, czy chcemy analizować pojedynczy gen czy genom , nasze docelowe DNA będzie się cechowało określoną długością. Praca z długą cząsteczką jest obarczona większym prawdopodobieństwem błędu, a czasem nawet technicznie niemożliwa, dlatego też fragmenty DNA do sekwencjonowania muszą być odpowiednio krótkie. Istnieją też techniki, w których preferowane są długie odczyty, takie jak np. sekwencjonowanie wykorzystywane przez urządzenie PacBio. Umożliwiają one znalezienie zmian w regionach, które cechują się dużą powtarzalnością „liter” – stanowi to duże ograniczenie dla metod, opierających się na krótkich fragmentach. Ten rodzaj generuje też bardziej pełny obraz genomu, bez przerw w odczytach, co pozwala na sekwencjonowanie nieznanych wcześniej genomów.

W opisanej jednak metodzie cząsteczka DNA zostaje zatem rozpleciona i pocięta na krótkie fragmenty. W jaki sposób możemy więc odczytać składające się na taki fragment litery? Wykorzystuje się do tego fakt, że zasady azotowe łączą się ze sobą wyłącznie w określony sposób (A z T, a C z G). Jeśli do takich krótkich nici dodamy mieszaninę nukleotydów, to przy pomocy odpowiednich enzymów, połączą się one ze sobą w odpowiednie pary. Do nukleotydów dołącza się specjalny barwnik fluorescencyjny, który podczas takiego parowania emituje kolorowe światło, inne dla każdej z czterech zasad azotowych.

Krok po kroku

Pojedynczy fragment DNA uzyskany po cięciu jest niezwykle mały – jeśli mielibyśmy tylko jedną jego kopię, to szansa na zarejestrowanie takiego światła przez detektor byłaby niewielka. Właśnie dlatego pierwszym krokiem sekwencjonowania jest amplifikacja. W celu wzmocnienia sygnału na taki, który można będzie zarejestrować, krótkie frgmenty DNA są powielane, żeby uzyskać miliony kopii. W przypadku technologii wykorzystywanej przez firmę Illumina służy do tego specjalny chip umieszczony w maszynie do sekwencjonowania. Do fragmentów DNA przyłączane są specjalne „etykiety”, które pozwalają na przyczepienie ich do chipu, a następnie tworzenie milionów kopii tego samego fragmentu.

Jeśli etap powielania fragmentów zakończy się sukcesem, w końcu można przejść do samego sekwencjonowania. Miliony fragmentów są teraz przyczepione do chipu, przez który przepływa ciecz z mieszaniną enzymów oraz nukleotydów. Nukleotydysą połączone z odpowiednim barwnikiem fluorescencyjnym. Kolejno, nukleotyd po nukleotydzie, sytnezowana jest nić komplemetarna do tej, zakotwiczonej na chipie. Towarzyszy temu emisja światła o określonym kolorze (4 opcje kolorystyczne, stosownie do 4 różnych nukleotydów). Rejestrowany wtedy obraz można porównać do ciągłych rozbłysków świateł w czterech kolorach, które są odczytywane i komputerowo zamieniane na litery odpowiadające jednym z 4 nukleotydów.

proces sekwencjonowania metodą illumina
Rys. 2 Proces sekwencjonowania metodą Illumina. W pierwszym wierszu możemy zobaczyć kolejno: krótkie fragmenty, które otrzymane zostały po cięciu DNA; dodanie do „etykiet” oraz zakotwiczenie tych fragmentów na chipie. W drugim wierszu schematycznie przedstawiony jest proces powielania krótkich fragmentów DNA. W trzecim widzimy kolejno: powielone fragmenty oraz właściwe sekwencjonowanie – kolejne przyłączenie się nukleotydów, emitujących światło o określonym kolorze, a na końcu obraz widzialny, analizowany przez detektor.
Źródło: https://www.intechopen.com/books/next-generation-sequencing-advances-applications-and-challenges/next-generation-sequencing-in-aquatic-models

Po sekwencjonowaniu następuje chyba najtrudniejsza część całego procesu – analiza otrzymanych danych. Do tego momentu posiadamy losowe sekwencje, które w jakiś sposób trzeba przecież z powrotem połączyć w całość – tak, jak rozpoczynaliśmy zabawę z całą cząsteczką DNA. Etap ten nazywa się mapowaniem i polega na przyrównaniu otrzymanych fragmentów do genomu referencyjnego i odpowiednim umiejscowianiu takich fragmentów. Zajmują się tym specjalne komputerowe algorytmy. W efekcie mapowania otrzymujemy dane, na które składają się miliony lub miliardy liter. Taki ciąg znaków i tak jest niczym szyfr – bez narzędzi bioinformatycznych i odpowiedniej analizy nie będziemy w stanie wyciągnąć z niego żadnych informacji.

Rozszyfrować choroby

Dlaczego odczytanie informacji zawartej w ludzkim genomie było tak ważne dla naukowców (i nie tylko)? Znając dokładną kolejność „liter” w genie, mamy informację dotyczącą budowy określonego białka. Sekwencjonując natomiast cały genom, dostajemy informację o wszystkich białkach wraz z dodatkowymi sekwencjami regulatorowymi. Białka są odpowiedzialne za niemal każdy proces zachodzący w organizmie: budują komórki i tkanki, transportują różnorakie substancje, służą jako przekaźniki informacji, katalizują wszystkie reakcje chemiczne; ich nieprawidłowa budowa najczęściej przyczynia się do powstania poważnych chorób.

Sekwencjonowanie jest więc niezwykle użyteczne w diagnostyce genetycznej. Istnieje wiele przypadków, w których postawienie diagnozy tylko na podstawie dolegliwości pacjenta jest bardzo trudne. Wiele schorzeń o podłożu genetycznym może występować ekstremalnie rzadko, co przekłada się na niepełną wiedzę na ich temat. Mutacje mogą też powstawać de novo, czyli dana osoba jest chora jako pierwsza w całej populacji. W takich przypadkach specjaliści mogą się wspomóc sekwencjonowaniem, by znaleźć w genach informację o przyczynie stanu chorobowego.

Niekiedy istnieją też sytuacje, w których trzeba potwierdzić lekarską diagnozę sekwencjonowaniem określonego genu. Przekłada się to wtedy na skuteczniejszą terapię, o ile taka istnieje, ponieważ przybliża nas to do odkrycia patomechanizmu choroby. Przed podaniem niektórych leków nowej generacji, zawsze wykonuje się badania genetyczne, które trzeba potwierdzić sekwencjonowaniem, ponieważ precyzyjnie uderzają w dany mechanizm molekularny. Za przykład może tu posłużyć Vemurafenib – lek stosowany m.in. w leczeniu czerniaka, podawany tylko w przypadku, kiedy nowotwór chorego cechuje się określoną mutacją w genie BRAF (mutacja znana jako V600E) , czy też badanie mutacji w genach BRCA1 i BRCA2 , które klasyfikują pacjentki z rakiem jajnika do chemioterapii inhibitorami PARP (np. dostępnym w Polsce olaparibem).

Nauka przed nami

Mogłoby się wydawać, że z chwilą zsekwencjonowania ludzkiego genomu, poznaliśmy już wszystkie tajemnice funkcjonowania naszego organizmu. Nic bardziej mylnego – nadal mamy nikłe pojęcie o tym, co kryje się w tych pozostałych 99% naszego genomu, który nie koduje białek. W przypadku chorób, sekwencjonowanie i analiza całego DNA też nie zawsze przekłada się na konkretne rozwiązanie terapeutyczne, mimo że jest w tym momencie najpotężniejszym narzędziem diagnostycznym. Rozpoczęty 40 lat temu przez Sangera proces „rozkodowywania” DNA pozwala nam patrzeć w głąb komórek, ale zapewne minie jeszcze wiele dekad zanim nauczymy posługiwać się płynnie tym kodem.

Podziel się: