/ /

Sekwencjonowanie genomu w pigułce. O poszukiwaniach igły w stogu siana

mgr Filip Wolbach
mgr Filip Wolbach 29 maj, 5 minut czytania

 

Pierwszy ludzki genom został zsekwencjonowany stosunkowo niedawno – projekt Human Genome Project (HGP) został zakończony w kwietniu 2003 roku. Zsekwencjonowanie wszystkich 3 miliardów nukleotydów, tworzących ludzki genom, zajęło naukowcom z całego świata 13 lat i kosztowało blisko 5 miliardów dolarów. Dzisiaj, dzięki niezwykłemu postępowi technicznemu i zastosowaniu najnowszych osiągnięć naukowo-technologicznych zsekwencjonowanie genomu ludzkiego możliwe jest nawet w 24 godziny!

Jednak sekwencjonowanie to dopiero początek.

 

Sekwencjonowanie genomu niczym szukanie igły w stogu siana

Kiedy patrzymy na genom pacjenta dotkniętego rzadką chorobą, szukamy igły – wariantu genetycznego – w ogromnym stogu siana, jakim jest ludzki genom. Pierwszym krokiem, który musimy wykonać w naszej analizie jest zmniejszenie tej sterty siana. Na szczęście 99,8% genomu jest takie samo u wszystkich ludzi, bez względu na ich pochodzenie, co trochę ułatwia sprawę. Nadal jednak istnieje około 4 milionów wariantów, którymi różnimy się między sobą – zdecydowana większość z nich jest nieszkodliwa, nie powoduje żadnych chorób czy objawów, ale za to wpływa na to, kim jesteśmy i jacy jesteśmy.

Sekwencjonowanie całego genomu (ang. whole genome sequencing, WGS) umożliwia odczyt wszystkich 3 miliardów nukleotydów składających się na całą informację genetyczną danej osoby. Pozwala to na odszukanie i odfiltrowanie tych 4 milionów wariantów, którymi różni się dana osoba od pozostałych ludzi. W tym celu porównujemy genom pacjenta do tzw. genomu referencyjnego, uzyskując nieco mniejszy stóg siana, z którym będziemy dalej pracować w celu odnalezienia przyczyny choroby. Proces filtrowania w znacznym stopniu jest zautomatyzowany i wykonywany przez bardzo zaawansowane superkomputery. Niezbędna jest natomiast wiedza i umiejętności doświadczonych bioinformatyków, którzy tworzą specjalne algorytmy na potrzeby tak skomplikowanych zadań, jak analiza genomu.

Teraz mamy już nieco mniejszy stóg siana, utworzony przez około 4 miliony wariantów genetycznych danego pacjenta. Przed nami etap, który jest najbardziej czasochłonną częścią całego zadania.

 

Analiza wyników sekwencjonowania genomu

Teraz do pracy przystępują analitycy genomowi. To właśnie oni, z pomocą bioinformatyków, dokładnie przeszukują 4 miliony wariantów, aby odnaleźć te „błędy”, które mogą tłumaczyć objawy pacjenta. Upraszczając, nazywa się je po prostu mutacjami lub wariantami genów. Analitycy odszyfrowują, w jaki sposób każdy z tych błędów może wpływać na funkcjonowanie organizmu danego człowieka. Pracując w zespole specjalistów, decydują, które z tych wariantów mogą być odpowiedzialne za istniejący problem, czyli objawy choroby. Ten etap analizy nazywamy również ‘adnotacją’.

Mamy już kilku winowajców – czyli listę wariantów potencjalnie zaangażowanych w patogenezę choroby pacjenta. Wciąż jednak jest ich o wiele za dużo – teraz nasz stóg siana został zredukowany do kilkunastu snopków. Nadal za dużo, aby precyzyjnie dobrać leczenie, a zatem wskazać mutację powodującą chorobę. Dlatego teraz niektóre warianty zostają odrzucone dzięki systemowi filtrowania, wykorzystując przy tym specjalnie do tego zaprojektowane narzędzia. Są to kolejne zaawansowane programy bioinformatyczne, które automatycznie łączą się i uzyskują dostęp do ogromnych, światowych baz danych. Takie bazy gromadzą informacje na temat tych wariantów genetycznych, które są powszechnie spotykane w populacji i nie powodują żadnych problemów zdrowotnych, jak również takich wariantów, które są znane ze swojej patogenności. W pierwszej kolejności odrzucamy teraz te warianty, o których wiadomo, że nie powodują objawów, są bardzo częste oraz takie, które nie pasują do objawów pacjenta.

 

Najtrudniejszy etap analizy wyników sekwencjonowania: ustalanie priorytetów i interpretacja kliniczna

To tutaj znajomość objawów pacjenta staje się kluczowa, zwłaszcza wtedy, gdy analizujemy pacjenta z podejrzeniem rzadkiej choroby genetycznej. Pytanie, które trzeba zadać, brzmi: jakie jest prawdopodobieństwo, że warianty genetyczne, które do tej pory zidentyfikowaliśmy, są przyczyną objawów pacjenta? W tym momencie analizy używamy tak zwanych ‘paneli’. Panele to nic innego jak zestawy genów, których mutacje mogą powodować dane choroby. Istnieją na przykład panele genów dla chorób neurodegeneracyjnych czy nowotworów. Panele nieustannie ewoluują, są rozszerzane o nowe geny, modyfikowane wraz z napływem nowej wiedzy. Porównujemy warianty genetyczne pacjenta z odpowiednim panelem, zawierającym warianty genów, o których wiadomo, że są związane z chorobą o takich samych lub podobnych objawach, jak objawy pacjenta. To nie zawsze się udaje – czasem przypadek bywa tak trudny, że wykorzystywana jest również wiedza zewnętrznych ekspertów w interpretacji klinicznej, w przypadku, gdyby zaprojektowane ‘panele’ nie wyłapały wszystkich informacji. Do tego dochodzą jeszcze inne elementy genomu, które dawniej nie były analizowane, bo nie były uznawane za geny, na przykład miRNA. Teraz wiemy już, że są istotne i mogą być zaangażowane w powstawanie objawów choroby, zwłaszcza nowotworów.

Wspomniane wyżej bazy danych genomowych są nieustannie budowane przez tysiące naukowców i lekarzy z całego świata. W tym procesie wykorzystuje się również programy komputerowe, które rozpoznają wzory objawów występujące wśród tych ludzi, u których przyczyna problemu została wcześniej poznana i mamy informacje na temat wariantów genetycznych, które zostały zidentyfikowane jako powodujące daną chorobę.

Teraz znowu wszystko w rękach analityków. Wytypowane warianty genetyczne (został nam już tylko jeden snopek, z całego początkowego stogu siana) są dokładnie sprawdzane przez analityków genomowych, którzy przeglądają listę potencjalnych błędów. Wykorzystują swoją wiedzę na temat sposobu, w jaki geny są dziedziczone, za co odpowiadają, jakie tworzą połączenia i z jakimi innymi genami współpracują. Porównują objawy pacjenta z listą potencjalnych błędów w DNA. Ustalają w ten sposób prawdopodobieństwo, czy zlokalizowane warianty genetyczne mogą być powodem objawów pacjenta.

W przypadku zlokalizowania wariantu genetycznego jako przyczyny choroby, test zostaje powtórzony jeszcze raz w celu potwierdzenia analizy. To oczywiście zabiera nieco więcej czasu, a jednak robimy to, aby mieć pewność, że do pacjenta zostaną dostarczone prawidłowe wyniki. Pamiętajmy, że dostarczony wynik pozwala na dobranie odpowiedniej, spersonalizowanej tereapii, zatem odpowiedzialność jest naprawdę duża.

 

Czy możliwe są nierozstrzygające wyniki analizy sekwencjonowania?

To również się zdarza i wynika przede wszystkim z tego, że genom jest bardzo skomplikowanym tworem i nie wszystko jeszcze o nim wiemy. U wielu pacjentów genetyczna przyczyna choroby nie zostanie zidentyfikowana, pomimo starań całego zespołu specjalistów. To nie znaczy, że jej tam nie ma. Nauka zwana genomiką ciągle się rozwija i dostarcza nowych informacji. Bardzo możliwe, że w przyszłości warianty genetyczne, które dzisiaj są nierozpoznane, zostaną uznane jako patogenne. Dlatego w przypadku tych wyników, które są niejednoznaczne, co pół roku wykonujemy reanalizę wyników sekwencjonowania genomu opartą o najnowsze dane naukowe. Bazy danych nieustannie się powiększają i są modyfikowane – korzystamy z dostępu do nich, aby wynik wydawany pacjentowi był zawsze najbardziej aktualny. Jeśli pojawi się doniesienie naukowe, z dowolnego miejsca na świecie, wykazujące, że z dużym prawdopodobieństwem dany wariant genetyczny jest jednak powiązany z chorobą, wracamy do pacjenta z nowymi informacjami. To bardzo ważne. Dzięki takiemu postępowaniu diagnoza pozostaje zwykle kwestią czasu, bo badanie sekwencjonowania genomu zostało już przeprowadzone, a lista wariantów możliwie zaangażowanych w powstawanie objawów choroby pacjenta wciąż u nas jest. Dzięki temu możemy wrócić do przypadku naszego pacjenta nawet po wielu latach, bo czasem musimy bardzo długo czekać, nim pojawią się wiarygodne wyniki nowych badań naukowych na temat danej rzadkiej choroby.

 

Sam finisz: raport z wynikami sekwencjonowania genomu

Obszerny raport z wynikami sekwencjonowania całego genomu pacjenta przekazujemy lekarzowi, zwykle specjaliście genetyki klinicznej. To bardzo ważne, ponieważ wiedzy genetycznej przybywa w szalonym tempie i nie każdy specjalista innej dziedziny może mieć te najbardziej aktualne dane. Następnie specjalista ma czas, aby zapoznać się z wynikami, aby móc omówić je z pacjentem podczas wizyty.

Cały ten proces, od pobrania krwi do uzyskania i omówienia wyników, może zająć wiele tygodni. To dlatego, że niektóre genomy są naprawdę trudne do interpretacji, ich analiza zajmuje nam więcej czasu, podczas gdy inne są łatwiejsze do zanalizowania i możemy szybciej uzyskać wynik. Taka sytuacja ma miejsce przykładowo w tzw. analizie trio: to rodzaj badania, podczas którego analizujemy nie tylko genom dziecka, ale także obojga jego rodziców.

Wiemy, jak ważne są te wyniki dla pacjenta, dlatego przeprowadzamy analizę tak szybko, jak to możliwe. Jednak szybkość nie może wpływać na jakość wyniku, a ta pozostaje naszym priorytetem.

 

Podziel się: