/ /

„Sharing is caring” dlaczego dzielenie się danymi ma sens?

mgr Katarzyna Zawadzka
mgr Katarzyna Zawadzka 30 sie, 5 minut czytania

Pierwszy raz z określeniem „Sharing is caring” spotkałam się na wykładzie prof. Heidi Rehm, dyrektor Broad Institute (https://www.broadinstitute.org/), unikatowej organizacji działającej przy MIT i Harvard University, która zajmuje się analizą danych genomowych, wdrażaniem pozyskanych z tych danych wiedzy i jej wykorzystaniem w codziennej praktyce klinicznej.

Prof. Rehm opowiadała, jak na przestrzeni lat kształtowała się diagnostyka genetyczna oraz jak coraz większa ilość danych gromadzonych i deponowanych w różnych instytucjach publicznych i prywatnych pozwoliła na coraz lepsze ich wykorzystanie w procesie diagnostycznym. Przytoczyła przykłady trudnych decyzji, jakie musiała podejmować jako konsultant genetyczny, kiedy wiedza w zakresie genetyki wciąż była niewielka, a danych na tyle mało, że nie były w stanie pomóc w interpretacji otrzymanego wyniku.

Wykład prof. Rehm przypomniał mi się po obejrzeniu serialu „Diagnoza” (Netflix). Wiele osób od dawna rekomendowało mi zwłaszcza pierwszy odcinek serialu, gdyż dotyczy diagnozy choroby genetycznej.

Angel, młoda dziewczyna, od dzieciństwa cierpiała na nieznaną chorobę, która uniemożliwiała jej normalne funkcjonowanie. Co kilka tygodni trafiała do szpitala z powodu paraliżującego bólu mięśni i wyczerpania, a jej mocz zamieniał się w czarną ciecz. Pomimo trwających od wielu lat prób zdiagnozowania jej dolegliwości, żadne badania nie przynosiły odpowiedzi.

Angel zgłosiła się do profesor Lisy Sanders, naukowczyni oraz dziennikarki medycznej pracującej na Uniwersytecie Yale, która od 2002 roku prowadzi kolumnę w New York Times, gdzie opisuje tajemnice medyczne i trudne do wyjaśnienia choroby [1].

Pomysłem Lisy Sanders na diagnozowanie niezwykle trudnych przypadków było szukanie i łączenie osób z podobnymi objawami na całym świecie. Dzięki dużej poczytności magazynu New York Times, doktor Sanders miała nadzieję, że ktoś, kto ma podobne doświadczenia, zgłosi się i pomoże w rozwiązaniu zagadki.

Prof. Sanders, tworząc lata temu ową stałą kolumnę w tak znanej gazecie, nie była świadoma, że za kilka lat w dobie Internetu i możliwości dzielenia się danymi z tysiącami osób jednocześnie, takie rozwiązanie może znacznie przyspieszyć proces uzyskania diagnozy, a tym samym ocalić ludzkie życie lub znacznie ograniczyć cierpienie i niepewność związane z brakiem właściwego rozpoznania. Angel pomogli naukowcy z Turynu, którzy za pośrednictwem Lisy Sanders zgłosili się do programu i przeprowadzili badanie całego eksomu (WES). Znaleźli uszkodzenie w genie CPT2, które powodowało niedobór enzymu odpowiedzialnego za metabolizowanie pewnych tłuszczów. Najwspanialszą jednak wiadomością dla Angel było to, że jej choroba jest stosunkowo łatwa w leczeniu i wymaga jedynie stosowania diety, która nie zawiera pewnych pokarmów.

 

Bazy danych odpowiedzią na wszystko?Text: 1 million submitted records in ClinVar represent more than 568,000 unique variants

Niedocenianym przez wielu badaczy, a zwłaszcza przez środowisko medyczne, źródłem wiedzy są bazy danych genów i powiązanych z nimi chorób, a także bardziej szczegółowe bazy wariantów genetycznych. Bazy takie możemy podzielić na wiele kategorii, np. bazy danych wariantów genetycznych, w których potwierdzona jest patogenność bądź łagodność konkretnych wariantów genetycznych. Przykładami takich baz jest ClinVar czy Decipher (https://www.ncbi.nlm.nih.gov/clinvar/; https://decipher.sanger.ac.uk/),w których raportowane są dane pochodzące zarówno z ośrodków naukowych, jak i firm prywatnych. Na początku tego roku ClinVar ogłosił, że w bazie zdeponowanych jest ponad 1 000 000 wpisów wniesionych przez ponad 1300 organizacji i ośrodków naukowych z 73 krajów [2].

 

World map showing level of ClinVar submissions by country. Text: 1,300 submitting organizations from 73 countries

Innym typem bazy jest tzw. baza populacyjna, jaką jest np. gnomAD (https://gnomad.broadinstitute.org/). W niej znajdują się statystyczne dane dotyczące każdego wykrytego wariantu genetycznego oraz jego częstości występowania w danej populacji. Dla interpretacji danych genetycznych pochodzących szczególnie z sekwencjonowania całych eksomów (badanie WES, czyli ang. whole exome sequencing, obejmujące około 1% całego materiału genetycznego) czy genomów (badanie WGS, czyli ang. whole genome sequencing, obejmujące cały ludzki genom), jest to niezwykle istotna informacja, która może mieć kluczowy wpływ na wynik diagnostyczny.

Niestety, bazy danych nie są wolne od błędów. W czasach, kiedy danych genetycznych przybywa bardzo dużo w krótkim czasie, należy mieć na uwadze, że niektóre dane mogą zawierać ograniczoną dokumentację oraz dowody wymagane do zakwalifikowania danego wariantu jako patogennego czy łagodnego. Czasem bywa również tak, że warianty, które umieszczone były w bazie dawno temu, dzisiaj już nie spełniają kryteriów stosowanych w nowoczesnej metodologii, czyli jednym słowem są zdezaktualizowane. Nad tymi problemami pracują jednak eksperci z wielu dziedzin – przeprowadzają „data curation” – eksperci nanoszą poprawki i aktualizują bazy danych, co jest jednym z istotniejszych działań zespołów sprawujących nadzór nad bazami danych.

Fakt, że większość baz danych jest ogólnodostępna, na bieżąco aktualizowana, nadzorowana i poprawiana przez ekspertów, jest godny podziwu i jest manifestacją pięknej idei „data sharing”w nauce. Wiedza, gromadzone dane i ekspertyza w zakresie chorób genetycznych i szeroko pojętej genetyki powinna działać w służbie pacjenta i tych, którzy tej wiedzy i diagnozy najbardziej potrzebują.

page28image1819968

Od danych zaczyna się wszystko

Choroby rzadkie to bardzo trudne zagadnienie nie tylko ze względu na trudności diagnostyczne, ale także terapeutyczne. Są to choroby, które dotykają stosunkowo niewielkiej liczby osób, ale za to różnych rodzajów takich chorób mamy bardzo dużo, bo do tej pory opisano ok. 7000-8000, a każdego miesiąca raportowane są nowe. Około 80% z nich może mieć podłoże genetyczne. W takim wypadku, myśląc o pracy nad tarapeutykiem, wszystko sprowadza się do doskonałego poznania przyczyn i podstaw powstania danej choroby.

W artykule o FOP [3] opisywałam historię doktora Kaplana, który rozpoczął pracę nad tym schorzeniem od jednego przypadku. Jeżdżąc po całym świecie i kontaktując się z pacjentami z podobnymi dolegliwościami, był w stanie dobrze poznać, które uszkodzenia w którym, konkretnym genie są odpowiedzialne za tą chorobę. Jego zespół spędził następnie wiele lat intensywnie i dogłębnie badając ścieżki biochemiczne i interakcje pomiędzy uszkodzonym białkiem i innymi komponentami komórkowymi, aby po 28 latach zaproponować konkretne rozwiązanie w postaci leku.

 

Nowe rozwiązania, nowe możliwości

„Data sharing” możliwy dzięki szybkiemu rozwojowi Internetu i komunikacji ma ogromy wpływ i niezwykle przyspiesza rozwój narzędzi diagnostycznych. Zaprezentowany przez prof. Rehm schemat działania różnych baz danych w roku 2013 znacznie różni się od tego, co naukowców, lekarzy i konsultantów genetycznych wspomaga dzisiaj:

page29image3804672

2013

2019

 

page29image1830272

Źródło: Heidi Rehm presentation – Genomics of Rare Diseases 2019, Wellcome Genome Campus,UK

 

Jako analityk genomowy, który korzysta z wszelkich dostępnych narzędzi podczas analizy genomu pacjenta, widzę ogromną wartość w inicjatywach podejmowanych przez wiele ośrodków naukowych i instytucji, mających na celu nie tylko dostarczanie jak najlepszej jakości danych do baz, ale aktywne dzielenie się tymi danymi i swoimi odkryciami, aby Ci, którzy najbardziej tego potrzebują, czyli pacjenci, mogli ze zdobytej wiedzy korzystać za pośrednictwem swoich dobrze przygotowanych i wyszkolonych lekarzy.

1M

 

Źródła:

  1. https://www.nytimes.com/by/lisa-sanders-md
  2. https://ncbiinsights.ncbi.nlm.nih.gov/2019/12/20/clinvar-celebrates-million-submissions/
  3. https://genetyka.bio/czlowiek-ktory-poswiecil-swoje-zycie-jednej-chorobie-fop-fibrodysplasia-ossificans-progressiva/

 

Publikacje:

 

 

Bazy danych wariantów genetycznych:

ClinVar – https://www.ncbi.nlm.nih.gov/clinvar/

HGMD – http://www.hgmd.cf.ac.uk/ac/index.php

LOVD – https://www.lovd.nl/

Decipher – https://decipher.sanger.ac.uk

ClinGen – https://clinicalgenome.org/

PanelApp – https://panelapp.genomicsengland.co.uk/

LSDBs – https://grenada.lumc.nl/LSDB_list/lsdbs

 

Bazy danych częstości wariantów:

GnomAD – https://gnomad.broadinstitute.org/

1000 Genomes Consortium – https://www.internationalgenome.org/

dbSNP – https://www.ncbi.nlm.nih.gov/snp/

 

 

 

Podziel się: