Dokowanie molekularne

Dokowanie molekularne[1] (ang. molecular docking) – metoda komputerowa pozwalająca na predykcję preferowanej pozycji ligandu po związaniu się z makromolekułą (np. białkiem) w jej miejscu wiążącym w celu utworzenia stabilnego kompleksu oraz interpretację występujących interakcji pomiędzy związanym ligandem a makrocząsteczką[2].

Zastosowanie edytuj

Dokowanie molekularne jest najpopularniejszą metodą projektowania leków opartą na strukturze[3] (SBDD, ang. structure-based drug design), czyli wtedy gdy znana jest dokładna struktura 3D celu molekularnego. Popularność przyniósł ogromny wzrost mocy obliczeniowej komputerów, który pozwolił na badanie powinowactwa (ang. affinity) wielu ligandów w krótkim czasie.

Głównym celem dokowania molekularnego jest określenie najlepszej pozycji ligandu względem makromolekuły pod kątem strukturalnym, ale również energetycznym. Obliczenia pozwalające na wybranie odpowiedniego ułożenia cząsteczki ligandu opierają się najczęściej o algorytmy komputerowe, które poprzez stopniową modyfikację cząsteczki potrafią dobrać najkorzystniejsze jej ułożenie. Wymienić tu można dla przykładu algorytmy stochastyczne – algorytm genetyczny (GA) oraz algorytm Monte Carlo (MC); czy też algorytm konstrukcji przyrostowej (IC, ang. incremental construction) oparty na fragmentacji ligandu i dokowaniu tych fragmentów do białka. Natomiast dopasowanie energetyczne, czyli przewidywana siła powinowactwa ligandu do białka, oszacowywana jest przy pomocy funkcji punktujących (ang. scoring function). Funkcje te można podzielić na 4 podstawowe typy: funkcje oparte na polach siłowych, funkcje empiryczne, funkcje oparte na wiedzy oraz funkcje oparte na uczeniu maszynowym.

Typy dokowanie molekulanego edytuj

Wyróżnić można dwa typy dokowania:

  • mała cząsteczka – makrocząsteczka – mała cząsteczka nazywana jest ligandem i najczęściej jest nią substancja endogenna lub egzogenna (np. lek) o małej masie molekularnej. Natomiast makrocząsteczką może być białko (enzym, receptor), peptyd, kwas nukleinowy (DNA, RNA) lub inny biopolimer.
  • makrocząsteczka – makrocząsteczka – tutaj najczęściej dokonuje się dokowania typu białko-białko lub peptyd-białko.
 
Wykres przedstawiający ogólny zarys metod stosowanych w komputerowym wspomaganiu projektowania leków

Koncept dokowania molekularnego edytuj

Metoda dokowania molekularnego była już rozpowszechniona w latach 80 XX w. i przyświecał jej cel odkrywania nowych leków in silico,, czyli za pomocą obliczeń komputera, w myśl nurtu racjonalnego projektowania leków[4]. Głównym zadaniem było skrócenie czasu produkcji nowych leków, określania ich powinowactwa oraz zdobycie wiedzy na temat potencjalnych modyfikacji leków w celu poprawy ich działania. Początkowo cały proces wiązania się ligandu z białkiem był traktowany jako struktura sztywna – zarówno ligand, jak i białko nie przybierało różnych konformacji podczas dokowania. Opierał się on na ówczesnym modelu działania enzymów na zasadzie dopasowania klucza do zamka[5]. Wraz ze wzrostem mocy obliczeniowej komputerów zaczęto zastanawiać się nad ulepszeniem tej metody. Nowy koncept działania enzymów opierający się na zasadzie indukowanego dopasowania, traktujący wszystkie procesy zachodzące w organizmie jako procesy dynamiczne, poskutkował modyfikacją metody dokowania. Na początku ligand zaczął przyjmować różne ułożenia w przestrzeni dzięki obrotom cząsteczki wokół wiązań rotujących w celu minimalizacji swojej energii. Następnie również aminokwasy znajdujące się w miejscu wiążącym, odpowiedzialne za interakcje z ligandem, zaczęły przyjmować różne konformacje. Taka metoda dokowania przyjęła nazwę dokowania elastycznego (ang. docking with flexible residue). Pozwoliło to na dokładniejszą estymację powinowactwa ligandu to celu molekularnego.

Etapy dokowania molekularnego edytuj

Podstawowym etapem jest przygotowanie struktur cząsteczek biorących udział w dokowaniu. Następnym jest określenie miejsca wiążącego ligand, potem wybranie odpowiedniego algorytmu modyfikującego struktury oraz odpowiedniej funkcji punktującej zapewniającej końcowy wynik obliczeń i symulacji. Wszystko to wykonuje się w programach komputerowych służących do dokowania molekularnego[6][7].

 
Etapy dokowania molekularnego

Przygotowanie makrocząsteczki, czyli celu molekularnego edytuj

Celem molekularnym najczęściej będzie białko. Do dokowania molekularnego potrzebna jest jego struktura 3D. Znaleźć ją można w wielu bibliotekach białek, a najpopularniejszą jest PDB (Protein Data Bank). Struktury 3D białek otrzymywane są tam na drodze krystalografii rentgenowskiej lub NMR. Ważnymi parametrami opisującymi te białka są rozdzielczość wykonanej analizy struktury 3D, jak również rodzaj ligandów jakie są związane z danym białkiem, bowiem rodzaj ligandu wiążącego wpływa na ogólną konformację białka co może wpłynąć potem na analizę wyników dokowania molekularnego. Natomiast rozdzielczość jest bardzo ważna przy określaniu dokładności estymacji pozycji ligandu po dokowaniu oraz parametru RMSD (ang. root main square deviation) przy kalibracji i walidacji metody dokowania.

Po odpowiednim wyborze struktury krystalicznej potrzebne jest jej przygotowanie do procesu dokowania. W zależności od tego jaki typ dokowania będzie przeprowadzany, dokonuje się odpowiednich modyfikacji. Przy standardowej procedurze podstawowymi czynnościami jest:

  • dodanie atomów wodoru do aminokwasów budujących białko – badania krystalografii rentgenowskiej oraz NMR pomijają te atomy i nie są one widoczne w strukturze,
  • dodanie ładunków cząstkowych do poszczególnych aminokwasów – wykorzystywane są tutaj różne metody obliczeniowe np. Kollman lub Gasteiger,
  • naprawienie lub uzupełnienie brakujących atomów w białku,
  • usunięcie cząsteczek wody (inaczej procedura wygląda przy dokowaniu uwodnionym[8][9][10][11][12][13][14]) – woda jest również obecna w strukturze krystalicznej i wykazuje wpływ na dokowanie oraz powinowactwo liganda do celu molekularnego. Jej usunięcie ma na celu zapewnienie większej swobody dopasowania ligandu w miejscu wiążącym, ale również zmniejszenie kosztu obliczeniowego. Niestety prowadzi to do mniej dokładnych oszacowań powinowactwa. W celu dokładniejszych obliczeń stosowane jest dokowanie uwodnione,
  • usunięcie inhibitora związanego z białkiem oraz innych heteroatomów należących często do endogennych substancji – zapewnia to „oczyszczenie” miejsca wiążącego i zapewnienie odpowiedniej przestrzeni do związania się badanego ligandu. Możliwe jest również pozostawienie endogennych cząsteczek w celu zbadania interakcji pomiędzy nimi a badanym ligandem,
  • ustawienie „ruchomych” aminokwasów w białku (procedura wykonywana tylko przy elastycznym dokowaniu) – pozwala to na wyznaczenie konkretnych aminokwasów, które mają rotować przy dokowaniu. Czynność ta zapewnia dokładniejsze wyniki powinowactwa oraz lepszą predykcję ułożenia się ligandu względem aminokwasów w miejscu wiążącym. Należy jednak pamiętać, że im więcej aminokwasów jest „elastycznych” tym więcej czasu zajmuje wykonanie analizy[15][16][17].

Istnieje jeszcze nowsze podejście do zagadnienia przygotowania białka do dokowania. Polega ono na uprzednim przeprowadzeniu symulacji dynamiki molekularnej białka rozpuszczonego w wodzie, a następnie dokonania albo uśrednienia struktury białka podczas całego procesu, albo stworzenia wielu struktur białkowych wyodrębnionych w poszczególnych etapach symulacji dynamiki molekularnej (ang. snapshot) i wyznaczenie z nich struktury uśrednionej poprzez superimpozycjonowanie tych struktur (ensamble structure)[18][19]. Po tych procesach dokonuje się przygotowania białka do dokowania.

Najnowsze odkrycia w dziedzinie uczenia maszynowego zapewniają również możliwość wykonania dokowania bez znajomości początkowej struktury białkowej. Mowa tutaj o programie AlphaFold[20][21], który na podstawie samej sekwencji aminokwasowej jest w stanie odtworzyć strukturę trzecio- i czwartorzędową białka ze średnią dokładnością ponad 90% (dokładność zależy w głównej mierze od typu białka i rodziny, z której pochodzi oraz dostępności struktur krystalicznych białek podobnych do niego).

Przygotowanie małej cząsteczki, czyli liganda edytuj

Przy projektowaniu leków ligandem zawsze jest lek. Leki w większości przypadków są inhibitorami enzymów lub antagonistami receptorów błonowych. Zadokowanie takie ligandu do białka będzie miało na celu zdobycie informacji w jakim stopniu dany lek „nadaje się” do bycia inhibitorem danego celu molekularnego. Wiedzę taką otrzymać można z powinowactwa danego leku do białka wyrażonego energią kompleksu (im mniejsza energia tym mocniej wiąże się dany ligand z białkiem) lub stałej wiązania. W celu zapewnienia rzetelności oraz odpowiedniej dokładności dokowania należy taki ligand przygotować, podobnie jak to miało miejsce z białkiem.

Jednakże pierwszym etapem jest znalezienie struktury liganda. Istnieje wiele bibliotek lub baz danych, w których można znaleźć informacje na temat struktury ligandu. Podstawową bazą danych jest PubChem (biblioteka zawierająca informacje na temat właściwości chemicznych i fizycznych cząsteczek oraz ich struktur 2D i 3D) lub ZINC. Jeśli ligandem jest lek można również korzystać z medycznych baz danych typu DrugBank i in. Po pobraniu odpowiedniej struktury należy ją przygotować pod względem optymalizacji konformacji przestrzennej oraz określić ładunki cząstkowe występujące na poszczególnych atomach. Na konformację przestrzenną wpływają długości wiązań oraz kąty między poszczególnymi atomami w cząsteczce, których wielkość jest dostosowywana do znalezienia lokalnego minimum energetycznego cząsteczki. Do określenia ładunków cząstkowych używane są metody oparte na mechanice kwantowej np. DFT[22][23] (ang. density functional theory) i podejściu ab initio lub też prostsze i mniej kosztowne czasowo metody oparte na wiedzy lub zestawie parametrów dla wybranych atomów lub ugrupowań. Ważną kwestią jest również odpowiednie uprotonowanie ligandu oraz dodanie brakujących ewentualnie atomów wodoru. Często również można określić liczbę wiązań rotacyjnych, które mają warunkować utworzenie ostatecznej konformacji.

Określenie miejsca wiążącego edytuj

Kolejnym etapem jest określenie miejsca wiążącego ligand (ang. binding site)[24][25]. W białkach można wyróżnić miejsca katalityczne odpowiedzialne za działanie i funkcjonowanie danego białka. W celu np. inhibicji działania, ligand musi przyłączyć się w określone miejsce w białku, dlatego poprawne wyznaczenie tego miejsca jest istotne dla prawidłowego dokowania. Takie miejsce wiążące zaznacza się najczęściej wyimaginowaną sferą bądź też prostopadłościanem (ang. grid box), które określa przestrzeń w jakiej ligand ma być zadokowany, a co za tym idzie zaznacza się, które dokładnie aminokwasy mają brać udział w wiązaniu się z ligandem. Wielkość takiej figury przestrzennej wyraża się w Angstremach (Å), natomiast położenie w przestrzeni zaznacza się w układzie Kartezjańskim. Wyznaczenie takiego miejsca wiążącego opiera się na:

  • danych literaturowych – w artykułach naukowych można znaleźć opis miejsca wiążącego w danym białku, najczęściej ma on charakter określenie, które aminokwasy pełnią kluczową rolę w oddziaływaniu z ligandem,
  • strukturze krystalicznej kompleksu danego białka z innym ligandem – w tym przypadku określa się miejsce wiążące na podstawie struktury kompleksu innego np. leku związanego z białkiem dzięki znajomości jego współrzędnych Kartezjańskich.

W przypadku braku wiedzy na temat dokładnego położenia miejsca wiążącego wykonuje się tzw. ślepe dokowanie (ang. blind docking)[26]. Polega ono na zaznaczeniu całego białka jako potencjalnego miejsca wiążącego i wykonaniu dokowania. Poprzez analizę zadokowanych cząsteczek, wyznacza się najdogodniejsze miejsce wiążące. Dodatkowo, jest jeszcze jedno rozwiązania pomocne przy braku jakichkolwiek danych na temat centrum aktywnego wykorzystujące algorytmy do obliczenia gdzie w białku znajdują się wolne przestrzenie i jakie jest prawdopodobieństwo, że dany obszar będzie miejscem wiążącym. Opierają się one głównie na homologii badanego białka do innych białek albo na podobieństwie geometrycznym lub energetycznym[27][28].

Algorytmy próbkowania (ang. Sampling algorithms) edytuj

Algorytmy próbkowania to algorytmy pozwalające na predykcję możliwych konformacji zarówno ligandu, jak i białka oraz ich możliwych kombinacji łączenia[29]. Zakładając, że każdy ligand ma 6 stopni swobody (3 translacyjne i 3 rotacyjne) oraz wiele stopni swobody konformacyjnych (w zależności od liczby wiązań w cząsteczce zdolnych do obrotu), daje to ogromną liczbę możliwych ułożeń liganda w miejscu wiążącym. Dokładając do tego możliwość rotacji „elastycznych” aminokwasów, otrzymuje się zbyt dużą liczbę potencjalnych konformacji co skutkuje wydłużonym czasem obliczeniowym. W celu oszczędzenia na czasie stosuje się właśnie algorytmy próbkowania. Każdy z nich charakteryzuje się unikatowością i wykorzystuje różne metody obliczeniowe żeby wytworzyć potencjalne konformacje cząsteczek. Ogólnie można je podzielić na 3 grupy:

  • algorytmy dopasowania kształtu
  • algorytmy systemowe
  • algorytmy stochastyczne
Algorytmy dopasowania kształtu edytuj

Algorytmy dopasowania kształtu są jednymi z najprostszych algorytmów próbkowania, który jest często stosowany na wczesnych etapach procesu dokowania lub na pierwszym etapie innych, bardziej zaawansowanych metod pobierania próbek ligandów. Stosuje on kryterium, które zakłada, że powierzchnia cząsteczkowa liganda musi być dopasowana do wyglądu i kształtu miejsca wiążącego (komplementarność liganda wobec miejsca aktywnego). Główną zaletą tego typu algorytmów jest szybkość obliczeniowa. Programy wykorzystujące tę metodę to np. DOCK, LigandFit, MS-DOCK.

Algorytmy systemowe edytuj

Algorytmy systemowe polegają na poszukiwaniu lokalnego lub systemowego (globalnego) minimum energetycznego poprzez rotację i zmianę położenia wszystkich elementów strukturalnych cząsteczki. Podzielić je jeszcze można na algorytmy systemowe wyczerpujące, fragmentacyjne lub konformacyjne. Główną różnicą pomiędzy nimi jest podejście z jakim się obchodzą z elastycznością liganda.

  • Algorytmy wyczerpujące[30] rotują wszystkimi możliwymi wiązaniami rotacyjnymi aż nie uzyskają minima energetycznego. W tym przypadku próbek jest bardzo dużo i czas obliczeniowy jest wydłużony, dlatego stosuje się ten algorytm tylko do małych ligandów. Przykładem programu, który wykorzystuje ten algorytm jest GLIDE,
  • Algorytmy fragmentacyjne polegają na pocięciu liganda na mniejsze części. Następnie zakotwicza się najlepiej pasującą część do miejsca wiążącego po czym do tej części dokłada się kolejne części liganda. Metoda ta jest nazywana przyrostową. Programem wykorzystującym ten algorytm jest FlexX, DOCK,
  • Algorytmy konformacyjne polegają na wcześniejszym wygenerowaniu potencjalnych konformacji liganda, a następnie przyrównaniu każdego z nich do miejsca wiążącego i określenia na tej podstawie najlepiej pasującego.
Algorytmy stochastyczne edytuj
 
Algorytm genetyczny
 
Algorytm Monte carlo

Algorytmy stochastyczne polegają na generowaniu losowych zmian w orientacji i konformacji liganda zarówno w przestrzeni konformacyjnej, jak i translacyjno-rotacyjnej. Na każdym kroku obliczeniowym, te losowe zmiany podlegają ocenie przez algorytm i zostają zaakceptowane do dalszych zmian bądź też odrzucone według kryterium probabilistycznego. Wymienić tu można 3 główne algorytmy stochastyczne:

  • Algorytm Genetyczny (GA)[31] jest typem algorytmów ewolucyjnych opierających się głównie na teorii ewolucji Darwina. Stopnie swobody cząsteczki liganda określone są jako ciągi binarne zwane „genami”. Te geny tworzą „chromosomy”, które reprezentują pozycję liganda w przestrzeni. Losowość w tym przypadku algorytmu polega na mutacjach genów i krzyżowaniu się chromosomów. Mutacje obejmują pojedyncze zmiany w genach, natomiast krzyżowania powodują wymianę genów pomiędzy chromosomami. Po takich wymianach genów powstaje nowa struktura ligandu, która od razu podlega funkcji punktującej i jeżeli „przetrwa” to zostaje przekazana do kolejnych generacji obliczeń. W skrócie, po każdym kroku obliczeń najlepsze struktury stają się kolejnymi początkowymi strukturami dla kolejnych obliczeń,
  • Algorytm Monte Carlo (MC)[32] jest algorytmem, który generuje losowe konformacje ligandu poprzez losowe rotacje wiązania, translacje sztywnej struktury ligandu lub jej obrót. Powstała konformacja jest testowana względem selekcji energetycznej, czyli jeśli struktura jest korzystna energetycznie to przechodzi do kolejnego etapu modyfikacji, natomiast jeżeli nie jest korzystna to zostaje odrzucona. Procedura jest powtarzana aż nie osiągnie energii założonej przed zastosowaniem algorytmu. Losowe zmiany są określane na podstawie funkcji prawdopodobieństwa Boltzmanna:
 

gdzie: E0 i E1 to energie ligandu przed i po losowej zmianie, KB to stała Boltzmanna, a T to temperatura układu,

  • Algorytm Kolonii Mrówek (ACO, ang. Ant Colony Optimization)[33] jest inspirowany zachowaniem prawdziwych mrówek, które znajdują najkrótszą drogę między swoim gniazdem a źródłem pożywienia. Mrówki wykorzystują komunikację pośrednią w postaci ścieżek feromonowych, które wyznaczają ścieżki między gniazdem a źródłem pożywienia. W przypadku dokowania białko-ligand wykorzystuje się sztuczną kolonię mrówek, aby znaleźć minimalną konformację energetyczną liganda w miejscu wiązania. Te mrówki są używane do naśladowania zachowania prawdziwych mrówek i oznaczania konformacji ligandów o niskiej energii za pomocą śladów feromonów. Informacje o śladach sztucznych feromonów są modyfikowane w kolejnych iteracjach w celu generowania konformacji o niskiej energii z większym prawdopodobieństwem.

Funkcje punktujące (ang. scoring functions) edytuj

 
Przedstawienie funkcji punktujących

Funkcje punktujące[34][35][36] to kluczowy element całego procesu dokowania molekularnego. To właśnie one pozwalają estymować powinowactwo ligandu do celu molekularnego oraz wykazać, która pozycja i ułożenie ligandu w miejscu wiążącym jest najkorzystniejsza energetycznie dla całego kompleksu. Niestety nie ma jednej, uniwersalnej, w pełni skutecznej i dokładnej funkcji punktującej. Tak właściwe każdy program do dokowania posiada swoją własną funkcję za pomocą, której oblicza powinowactwo ligandu do białka. Wyniki otrzymane z dokowania są układane wg malejącego powinowactwa i generalnie pozycja ligandu o najmniejszej energii jest traktowana jako ta najlepsza. W praktyce jednak to badacz decyduje, które ułożenie ligandu jest najkorzystniejsze i najbardziej realne.

Każda z tych funkcji charakteryzuje się 4 podstawowymi cechami:

  • siła punktująca – zdolność do produkowania wyników z liniową korelacją z danymi eksperymentalnymi
  • siła rankingowa – zdolność do prawidłowego umiejscowienia w rankingu estymowanych pozycji ligandów
  • siła dokująca – zdolność do identyfikacji natywnej pozycji wiążącej liganda jako tej z najlepszym wynikiem
  • siła przesiewowa – zdolność do identyfikacji prawdziwych związków wiążących się z białkiem wśród dostępnej biblioteki z losowymi ligandami

Każdą z funkcji można przypisać do jednej z 4 kategorii różniących się założeniami i uproszczeniami, które zostały użyte ze względu na bardzo duży problem obliczeniowy jakim jest bardzo dokładne obliczenie powinowactwa ligandu do danego białka. Wymienić tu można:

  • funkcje oparte na wiedzy – wykorzystują analizy statystyczne do wyprowadzenia zaobserwowanych częstotliwości kontaktów międzyatomowych i/lub odległości z kompleksów białko-ligand zawartych w bazach danych struktur krystalicznych (np. PDB) i wykorzystują prawo Boltzmanna do przekształcenia preferencji par atomów w potencjały par zależne od odległości. W skrócie, funkcja ta zakłada, że im częściej pojawia się dana interakcja między atomami w strukturach wyznaczonych eksperymentalnie tym korzystniejsza jest ta interakcja, co może skutkować zwiększeniem powinowactwa liganda do białka,
  • funkcje empiryczne[37] – oszacowują powinowactwo wiązania kompleksu ligand-białko poprzez zsumowanie różnych czynników energetycznych zaangażowanych w wiązanie ligand-białko, takich jak wiązania wodorowe, efekty hydrofobowe, niekorzystne międzycząsteczkowe interakcje (ang. clashes), energia elektrostatyczna, wartość desolwatacji, wartość entropii itp. Każdy z tych czynników jest mnożony przez odpowiedni współczynnik obliczony z wielokrotnej analizy regresji liniowej opartej na zestawie treningowym kompleksów ligand-białko. Przykładami takich funkcji punktujących są GlideScore, ChemScore,
 

gdzie: ΔGi oznacza czynnik energetyczny, Wi oznacza współczynnik, ΔG oznacza energię kompleksu ligand-białko.

  • funkcje oparte na polach siłowych/oparte na fizyce – oszacowują wynik poprzez zsumowanie energii interakcji wiążących (ang. bonded interactions) i niewiążących (ang. non-bonded interactions) wraz z energią pochodzącą z wiązań wodorowych z wykorzystanie zbioru parametrów określonych przez dane pole siłowe[38][39] (np. AMBER lub CHARMM), dane eksperymentalne oraz obliczenia ab initio. Interakcje wiążące to rozciąganie wiązań, kąty zginania oraz kąty torsyjne, natomiast interakcje niewiążące to oddziaływania van der Wallsa oraz interakcje elektrostatyczne. Nowsze funkcje oparte na polach siłowych uwzględniają również energię z entropii oraz energię solwatacyjną. Przykładami programów używających takich funkcji są AutoDock, DOCK i GOLD. Oddziaływania elektrostatyczne obliczane są na podstawie prawa Coulomba, a oddziaływania van der Wallsa opisane są poprzez funkcję potencjałów Lennarda-Jonesa 12/6. Przykład funkcji punktującej z programu DOCK:
 

gdzie: rij to dystans pomiędzy atomem białka i i atomem ligandu j, Aij oraz Bij to parametry sił van der Wallsa, qi oraz qj to ładunki atomów, ε(rij) to 4rij odpowiadające interakcjom elektrostatycznym wody.

  • funkcje oparte na uczeniu maszynowym – wykorzystują bardziej zaawansowane techniki, takie jak lasy losowe (RF), maszyny wektorów pomocniczych (SVM), deep learning (DL), sztuczne połączenia neuronalne (ANN)[40][41], aby przybliżać problemy nieliniowe:
    • lasy losowe[42] (ang. random forest) – jest metodą uczenia zespołowego, która wprowadza strategie grupowania i selekcji podzbiorów do wielu drzew decyzyjnych (DT). Każde drzewo jest trenowane przez losowo próbkowane podzbiory zamiast oryginalnego zbioru danych, a następnie tworzony jest odpowiedni wynik konsensusu poprzez integrację danych wyjściowych z wielu drzew decyzyjnych,
    • maszyny wektorów pomocniczych (ang. support vector machines) – to zestaw nadzorowanych metod uczenia, które są w stanie obsługiwać zmienne wysokowymiarowe dla małych zbiorów danych. SVM rozwiązują problemy klasyfikacji, używając nieliniowych funkcji jądra do mapowania danych w przestrzeni wielowymiarowej, znajdując optymalnie oddzielającą hiperpłaszczyznę, podczas gdy regresję osiąga się przez wyszukiwanie hiperpłaszczyzny ze zoptymalizowaną sumą odległości od punktów danych do hiperpłaszczyzny,
    • sztuczne połączenia neuronalne – to sieci składające się na ogół z kilku prostych neuronów, ułożonych w określoną topologię i połączonych ze sobą, które są zorganizowane w warstwy dzielące się na warstwy wejściowe, warstwy ukryte i warstwy wyjściowe na podstawie ich lokalizacji. Pierwszym zaproponowanym połączeniem neuronalnym był NNScore[43] zaprojektowany jako klasyfikator dobrych i słabych ligandów wiążących. Oparty był na zdefiniowanych pięciu typach potencjałów parowych w celu scharakteryzowania kontaktów bliskich, pół-bliskich, energii elektrostatycznych, ilości typów atomów danego ligandu oraz liczby wiązań rotacyjnych, ostatecznie uzyskując 194 cechy.

Problemy związane z dokowaniem edytuj

Dzięki zyskującej popularności i ciągłego przyrostu nowych publikacji naukowych opartych na dokowaniu molekularnym, zostało odkryte wiele problemów związanych z samym procesem dokowania[44]. Najpopularniejsze z nich to:

  • złe dobranie miejsca wiążącego/centra aktywnego
  • wirtualny screening z użyciem złej lub zbyt małej biblioteki substancji małocząsteczkowych
  • niepoprawny dobór najlepszej pozycji i konformacji liganda po dokowaniu
  • wysokie powinowactwo liganda przy dokowaniu, ale wykazujące słabą siłę wiązania podczas symulacji dynamiki molekularnej
  • brak pewności czy dany ligand jest agonistą czy antagonistą danego białka
  • nieuwzględnienie cząsteczek wody w cząsteczce białka zakłóca uzyskanie poprawnego wyniku dokowania
  • nieuwzględnienie dynamiki białka, poprzez np. elastyczne aminokwasy, również prowadzi do nieprecyzyjnych wartości powinowactwa[45]
 
Określanie powinowactwa ligandu do białka poprzez dynamikę molekularną

Programy używane do dokowania molekularnego edytuj

Istnieje wiele programów służących do dokowania molekularnego[46]. Każdy z nich charakteryzuje się swoim protokołem wykonania dokowania, ale etapy wymienione wyżej są obecne w każdym z nich. Dodatkowo, każdy używa różnych algorytmów próbkowania oraz funkcji punktujących. Wiele z nich jest typu open-source, niektóre natomiast są skomercjalizowane, czyli potrzebny jest zakup licencji na dany okres użytkowania[47]. Najpopularniejsze z nich to:

 
Popularność programów do dokowania molekularnego w latach 1990–2013

Zastosowanie dokowania molekularnego edytuj

Dokowanie molekularne znajduje zastosowanie w:

  • oparte na strukturze wirtualne badania przesiewowe w celu identyfikacji nowych związków aktywnych w kierunku określonego białka docelowego
  • dokowanie w połączeniu z innymi technikami obliczeniowymi i danymi eksperymentalnymi może również brać udział w analizie metabolizmu leków w celu uzyskania przydatnych informacji z układu cytochromu P450
  • zdobycie wiedzy na temat ułożenia się cząsteczki leku w przestrzeni miejsca wiążącego oraz określenie interakcji pomiędzy lekiem a celem molekularnym na poziomie molekularny
  • preparatyka kompleksu ligand-białko do prawidłowo wykonanej symulacji dynamiki molekularnej[57][58]
  • analiza wpływu modyfikacji chemicznych cząsteczek leku na powinowactwo danego leku do białka

Zobacz też edytuj

Przypisy edytuj

  1. Francesca Stanzione, Ilenia Giangreco, Jason C. Cole, Chapter Four – Use of molecular docking computational tools in drug discovery, David R. Witty, Brian Cox (red.), t. 60, Elsevier, 2021, s. 273–343, DOI10.1016/bs.pmch.2021.01.004 [dostęp 2022-01-16] (ang.).
  2. Gerard Pujadas i inni, Protein-ligand Docking: A Review of Recent Advances and Future Perspectives, „Current Pharmaceutical Analysis”, 4 (1), 2008, s. 1–19, DOI10.2174/157341208783497597, ISSN 1573-4129 [dostęp 2022-01-16].
  3. Gregory Sliwoski i inni, Computational Methods in Drug Discovery, „Pharmacological Reviews”, 66 (1), 2014, s. 334–395, DOI10.1124/pr.112.007336, ISSN 0031-6997, PMID24381236, PMCIDPMC3880464 [dostęp 2022-01-16] (ang.).
  4. Che-Lun Hung, Chi-Chun Chen, Computational Approaches for Drug Discovery, „Drug Development Research”, 75 (6), 2014, s. 412–418, DOI10.1002/ddr.21222, ISSN 0272-4391 [dostęp 2022-01-16].
  5. Daniel E. Koshland, The Key–Lock Theory and the Induced Fit Theory, „Angewandte Chemie International Edition in English”, 33 (2324), 1995, s. 2375–2378, DOI10.1002/anie.199423751, ISSN 0570-0833 [dostęp 2022-01-16].
  6. Xuan-Yu Meng i inni, Molecular Docking: A Powerful Approach for Structure-Based Drug Discovery, „Current Computer Aided-Drug Design”, 7 (2), 2011, s. 146–157, DOI10.2174/157340911795677602, ISSN 1573-4099 [dostęp 2022-01-16].
  7. Sheng-You Huang, Xiaoqin Zou, Advances and Challenges in Protein-Ligand Docking, „International Journal of Molecular Sciences”, 11 (8), 2010, s. 3016–3034, DOI10.3390/ijms11083016, ISSN 1422-0067 [dostęp 2022-01-16].
  8. Stefano Forli, Arthur J. Olson, A Force Field with Discrete Displaceable Waters and Desolvation Entropy for Hydrated Ligand Docking, „Journal of Medicinal Chemistry”, 55 (2), 2012, s. 623–638, DOI10.1021/jm2005145, ISSN 0022-2623 [dostęp 2022-01-16].
  9. Julien Michel, Julian Tirado-Rives, William L. Jorgensen, Prediction of the Water Content in Protein Binding Sites, „The Journal of Physical Chemistry B”, 113 (40), 2009, s. 13337–13346, DOI10.1021/jp9047456, ISSN 1520-6106 [dostęp 2022-01-16] (ang.).
  10. Marley L. Samways i inni, Water molecules at protein–drug interfaces: computational prediction and analysis methods, „Chemical Society Reviews”, 50 (16), 2021, s. 9104–9120, DOI10.1039/d0cs00151a, ISSN 0306-0012 [dostęp 2022-01-16].
  11. Ligand-Protein Docking with Water Molecules, DOI10.1021/ci700285e.s002 [dostęp 2022-01-16].
  12. Prediction of Ordered Water Molecules in Protein Binding Sites from Molecular Dynamics Simulations: The Impact of Ligand Binding on Hydration Networks, DOI10.1021/acs.jcim.7b00520.s001 [dostęp 2022-01-16].
  13. Gregory A. Ross, Garrett M. Morris, Philip C. Biggin, Rapid and Accurate Prediction and Scoring of Water Molecules in Protein Binding Sites, „PLoS ONE”, 7 (3), 2012, e32036, DOI10.1371/journal.pone.0032036, ISSN 1932-6203 [dostęp 2022-01-16].
  14. Alessio Amadasi i inni, Robust Classification of “Relevant” Water Molecules in Putative Protein Binding Sites, „Journal of Medicinal Chemistry”, 51 (4), 2008, s. 1063–1067, DOI10.1021/jm701023h, ISSN 0022-2623 [dostęp 2022-01-16].
  15. Maxim Totrov, Ruben Abagyan, Flexible ligand docking to multiple receptor conformations: a practical alternative, „Current Opinion in Structural Biology”, 18 (2), 2008, s. 178–184, DOI10.1016/j.sbi.2008.01.004, ISSN 0959-440X [dostęp 2022-01-16].
  16. Chandrika B-Rao, Jyothi Subramanian, Somesh D. Sharma, Managing protein flexibility in docking and its applications, „Drug Discovery Today”, 14 (7–8), 2009, s. 394–400, DOI10.1016/j.drudis.2009.01.003, ISSN 1359-6446 [dostęp 2022-01-16].
  17. Pietro Cozzini, ChemInform Abstract: Target Flexibility: An Emerging Consideration in Drug Discovery and Design, „ChemInform”, 40 (3), 2009, DOI10.1002/chin.200903235, ISSN 0931-7597 [dostęp 2022-01-16].
  18. Rommie E. Amaro i inni, Ensemble Docking in Drug Discovery, „Biophysical Journal”, 114 (10), 2018, s. 2271–2278, DOI10.1016/j.bpj.2018.02.038, ISSN 0006-3495, PMID29606412, PMCIDPMC6129458 [dostęp 2022-01-16].
  19. Sheng-You Huang, Xiaoqin Zou, Ensemble docking of multiple protein structures: Considering protein structural variations in molecular docking, „Proteins: Structure, Function, and Bioinformatics”, 66 (2), 2006, s. 399–421, DOI10.1002/prot.21214, ISSN 0887-3585 [dostęp 2022-01-16].
  20. Janusz Bujnicki, Faculty Opinions recommendation of Highly accurate protein structure prediction with AlphaFold., „Faculty Opinions – Post-Publication Peer Review of the Biomedical Literature”, 2021, DOI10.3410/f.740477161.793587947 [dostęp 2022-01-16].
  21. Janusz Bujnicki, Faculty Opinions recommendation of Highly accurate protein structure prediction for the human proteome., „Faculty Opinions – Post-Publication Peer Review of the Biomedical Literature”, 2021, DOI10.3410/f.740510745.793587948 [dostęp 2022-01-16].
  22. What is Density Functional Theory?, Hoboken, NJ, USA: John Wiley & Sons, Inc., s. 1–33, DOI10.1002/9780470447710.ch1 [dostęp 2022-01-16].
  23. Steven M. Bachrach, Computational organic chemistry, Wiley-Interscience, 2007, ISBN 978-0-470-14812-9, OCLC 180192820 [dostęp 2022-01-16].
  24. Stephen J Campbell i inni, Ligand binding: functional site location, similarity and docking, „Current Opinion in Structural Biology”, 13 (3), 2003, s. 389–395, DOI10.1016/s0959-440x(03)00075-7, ISSN 0959-440X [dostęp 2022-01-16].
  25. Zhong-Ru Xie, Ming-Jing Hwang, Methods for Predicting Protein–Ligand Binding Sites, New York, NY: Springer New York, 3 września 2014, s. 383–398, DOI10.1007/978-1-4939-1465-4_17, ISBN 978-1-4939-1464-7 [dostęp 2022-01-16].
  26. Yang Liu i inni, CB-Dock: a web server for cavity detection-guided protein–ligand blind docking, „Acta Pharmacologica Sinica”, 41 (1), 2019, s. 138–144, DOI10.1038/s41401-019-0228-6, ISSN 1671-4083 [dostęp 2022-01-16].
  27. Mark N. Wass, Lawrence A. Kelley, Michael J.E. Sternberg, 3DLigandSite: predicting ligand-binding sites using similar structures, „Nucleic Acids Research”, 38 (suppl_2), 2010, W469–W473, DOI10.1093/nar/gkq406, ISSN 1362-4962 [dostęp 2022-01-16].
  28. Jonathan C. Fuller, Nicholas J. Burgoyne, Richard M. Jackson, Predicting druggable binding sites at the protein–protein interface, „Drug Discovery Today”, 14 (3–4), 2009, s. 155–161, DOI10.1016/j.drudis.2008.10.009, ISSN 1359-6446 [dostęp 2022-01-16].
  29. B. Sandak, Efficient Computational Algorithms for Fast Electrostatics and Molecular Docking, Berlin, Heidelberg: Springer Berlin Heidelberg, 2002, s. 411–441, DOI10.1007/978-3-642-56080-4_17, ISBN 978-3-540-43756-7 [dostęp 2022-01-16].
  30. Hitoshi Goto, Eiji Osawa, Corner flapping: a simple and fast algorithm for exhaustive generation of ring conformations, „Journal of the American Chemical Society”, 111 (24), 1989, s. 8950–8951, DOI10.1021/ja00206a046, ISSN 0002-7863 [dostęp 2022-01-16].
  31. Michael D. Vose, Simple genetic algorithm. Foundations and theory, [publisher not identified], ISBN 978-0-262-28564-3, OCLC 956674574 [dostęp 2022-01-16].
  32. R. Rohs, Molecular flexibility in ab initio drug docking to DNA: binding-site and binding-mode transitions in all-atom Monte Carlo simulations, „Nucleic Acids Research”, 33 (22), 2005, s. 7048–7057, DOI10.1093/nar/gki1008, ISSN 0305-1048 [dostęp 2022-01-16].
  33. Oliver Korb, Thomas Stützle, Thomas E. Exner, PLANTS: Application of Ant Colony Optimization to Structure-Based Drug Design, Berlin, Heidelberg: Springer Berlin Heidelberg, 2006, s. 247–258, DOI10.1007/11839088_22, ISBN 978-3-540-38482-3 [dostęp 2022-01-16].
  34. Jin Li, Ailing Fu, Le Zhang, An Overview of Scoring Functions Used for Protein–Ligand Interactions in Molecular Docking, „Interdisciplinary Sciences: Computational Life Sciences”, 11 (2), 2019, s. 320–328, DOI10.1007/s12539-019-00327-w, ISSN 1913-2751 [dostęp 2022-01-16].
  35. Bruce R. Donald, Algorithms in structural molecular biology, MIT Press, 2011, ISBN 978-0-262-01559-2, OCLC 667592553 [dostęp 2022-01-16].
  36. Renxiao Wang, Yipin Lu, Shaomeng Wang, Comparative Evaluation of 11 Scoring Functions for Molecular Docking, „Journal of Medicinal Chemistry”, 46 (12), 2003, s. 2287–2303, DOI10.1021/jm0203783, ISSN 0022-2623 [dostęp 2022-01-16].
  37. Maciej Wójcikowski, Pawel Siedlecki, Pedro J. Ballester, Building Machine-Learning Scoring Functions for Structure-Based Prediction of Intermolecular Binding Affinity, New York, NY: Springer New York, 2019, s. 1–12, DOI10.1007/978-1-4939-9752-7_1, ISBN 978-1-4939-9751-0 [dostęp 2022-01-16].
  38. Alexander D. Mackerell, Empirical force fields for biological macromolecules: Overview and issues, „Journal of Computational Chemistry”, 25 (13), 2004, s. 1584–1604, DOI10.1002/jcc.20082, ISSN 0192-8651 [dostęp 2022-01-16].
  39. Jay W. Ponder, David A. Case, Force Fields for Protein Simulations, Elsevier, 2003, s. 27–85, DOI10.1016/s0065-3233(03)66002-x [dostęp 2022-01-16].
  40. Chao Shen i inni, From machine learning to deep learning: Advances in scoring functions for protein–ligand docking, „WIREs Computational Molecular Science”, 10 (1), 2019, DOI10.1002/wcms.1429, ISSN 1759-0876 [dostęp 2022-01-16].
  41. Jones i inni, Improved Protein-ligand Binding Affinity Prediction with Structure-Based Deep Fusion Inference, 17 maja 2020, OCLC 1228408141 [dostęp 2022-01-16].
  42. Hongjian Li i inni, Improving AutoDock Vina Using Random Forest: The Growing Accuracy of Binding Affinity Prediction by the Effective Exploitation of Larger Data Sets, „Molecular Informatics”, 34 (2–3), 2015, s. 115–126, DOI10.1002/minf.201400132, ISSN 1868-1743 [dostęp 2022-01-16].
  43. Jacob D. Durrant, J. Andrew McCammon, NNScore: A Neural-Network-Based Scoring Function for the Characterization of Protein–Ligand Complexes, „Journal of Chemical Information and Modeling”, 50 (10), 2010, s. 1865–1871, DOI10.1021/ci100244v, ISSN 1549-9596 [dostęp 2022-01-16].
  44. Yu-Chian Chen, Erratum: Beware of Docking!, „Trends in Pharmacological Sciences”, 36 (9), 2015, s. 617, DOI10.1016/j.tips.2015.01.004, ISSN 0165-6147 [dostęp 2022-01-16].
  45. Cosolvent and Dynamic Effects in Binding Pocket Search by Docking Simulations, DOI10.1021/acs.jcim.1c00924.s001 [dostęp 2022-01-16].
  46. Nataraj S. Pagadala, Khajamohiddin Syed, Jack Tuszynski, Software for molecular docking: a review, „Biophysical Reviews”, 9 (2), 2017, s. 91–102, DOI10.1007/s12551-016-0247-1, ISSN 1867-2450 [dostęp 2022-01-16].
  47. Eric D. Boittier i inni, Assessing Molecular Docking Tools to Guide Targeted Drug Discovery of CD38 Inhibitors, „International Journal of Molecular Sciences”, 21 (15), 2020, s. 5183, DOI10.3390/ijms21155183, ISSN 1422-0067 [dostęp 2022-01-16].
  48. Juan Pablo Arcon i inni, AutoDock Bias: improving binding mode prediction and virtual screening using known protein–ligand interactions, „Bioinformatics”, 35 (19), 2019, s. 3836–3838, DOI10.1093/bioinformatics/btz152, ISSN 1367-4803 [dostęp 2022-01-16].
  49. Leonardo Solis-Vasquez i inni, Benchmarking the performance of irregular computations in AutoDock-GPU molecular docking, „Parallel Computing”, 109, 2022, s. 102861, DOI10.1016/j.parco.2021.102861, ISSN 0167-8191 [dostęp 2022-01-16].
  50. Xuben Hou i inni, How to Improve Docking Accuracy of AutoDock4.2: A Case Study Using Different Electrostatic Potentials, „Journal of Chemical Information and Modeling”, 53 (1), 2013, s. 188–200, DOI10.1021/ci300417y, ISSN 1549-9596 [dostęp 2022-01-16].
  51. Oleg Trott, Arthur J. Olson, AutoDock Vina: Improving the speed and accuracy of docking with a new scoring function, efficient optimization, and multithreading, „Journal of Computational Chemistry”, 2009, NA–NA, DOI10.1002/jcc.21334, ISSN 0192-8651 [dostęp 2022-01-16].
  52. Vsevolod Tanchuk i inni, A New Scoring Function for Molecular Docking Based on AutoDock and AutoDock Vina, „Current Drug Discovery Technologies”, 12 (3), 2015, s. 170–178, DOI10.2174/1570163812666150825110208, ISSN 1570-1638 [dostęp 2022-01-16].
  53. Demetri T. Moustakas i inni, Development and validation of a modular, extensible docking program: DOCK 5, „Journal of Computer-Aided Molecular Design”, 20 (10–11), 2006, s. 601–619, DOI10.1007/s10822-006-9060-4, ISSN 0920-654X [dostęp 2022-01-16].
  54. Glide: A New Approach for Rapid, Accurate Docking and Scoring. I. Method and Assessment of Docking Accuracy, DOI10.1021/jm0306430.s001 [dostęp 2022-01-16].
  55. Marcel L. Verdonk i inni, Improved protein-ligand docking using GOLD, „Proteins: Structure, Function, and Bioinformatics”, 52 (4), 2003, s. 609–623, DOI10.1002/prot.10465, ISSN 0887-3585 [dostęp 2022-01-16].
  56. Bernd Kramer, Matthias Rarey, Thomas Lengauer, Evaluation of the FLEXX incremental construction algorithm for protein-ligand docking, „Proteins: Structure, Function, and Genetics”, 37 (2), 1999, s. 228–241, DOI10.1002/(sici)1097-0134(19991101)37:2<228::aid-prot8>3.0.co;2-8, ISSN 0887-3585 [dostęp 2022-01-16].
  57. Veronica Salmaso, Stefano Moro, Bridging Molecular Docking to Molecular Dynamics in Exploring Ligand-Protein Recognition Process: An Overview, „Frontiers in Pharmacology”, 9, 2018, DOI10.3389/fphar.2018.00923, ISSN 1663-9812 [dostęp 2022-01-16].
  58. Hernan Alonso, Andrey A. Bliznyuk, Jill E. Gready, Combining Docking and Molecular Dynamic Simulations in Drug Design, „ChemInform”, 37 (45), 2006, DOI10.1002/chin.200645280, ISSN 0931-7597 [dostęp 2022-01-16].