International Chemical Identifier: Różnice pomiędzy wersjami

[wersja przejrzana][wersja przejrzana]
Usunięta treść Dodana treść
Wipur (dyskusja | edycje)
m drobne redakcyjne, drobne merytoryczne
Wipur (dyskusja | edycje)
m drobne redakcyjne
Linia 1:
{{Czy wiesz do artykułu|8}}
'''International Chemical Identifier''', '''InChI'''{{refn|W literaturze polskojęzycznej pojawia się tłumaczenie „'''międzynarodowy identyfikator chemiczny'''”<ref>{{cytuj|url=https://echa.europa.eu/documents/10162/23036412/substance_id_pl.pdf/1a30db2a-852f-44ca-9b14-cc86abd536f6 |s=12 |tytuł=Poradnik dotyczący identyfikacji i nazywania substancji na podstawie rozporządzeń REACH i CLP |data=2017 |isbn=978-92-9495-724-5 |doi=10.2823/279785 |wydawca=Europejska Agencja Chemikaliów |miejsce=Helsinki}}</ref>, ale nie jest to ugruntowana polska nazwa tego identyfikatora.|grupa=uwaga}}, skrótowiec: '''InChI''' – [[identyfikator]] stosowany dla [[substancja chemiczna|substancji chemicznych]], wprowadzony w 2005 roku przez [[Międzynarodowa Unia Chemii Czystej i Stosowanej|Międzynarodową Unię Chemii Czystej i Stosowanej]] (IUPAC) przy udziale, między innymi, amerykańskiego {{j|en|[[National Institute of Standards and Technology]]}} (NIST).
 
== Historia ==
Począwszy od lat 60. XX wieku rozwój informatyki spowodował potrzebę opracowania metody komputerowego opisu struktur chemicznych i jednoznacznej identyfikacji substancji chemicznej. Do końca wieku powstało wiele takich metod, z których najczęściej stosowanymi okazały się m.in. [[SMILES]] czy [[numer CAS]] powiązany z bazą CAS Registry. Duża liczba powstałych standardów i rozwiązań miała jednak pewne ograniczenia: nie były one ze sobą w żaden sposób powiązane, część była wykorzystywana jedynie w wąskim zakresie, a wiele było standardami własnościowymi, tj. opracowanymi przez prywatne przedsiębiorstwa i wymagającymi od użytkowników np. opłat licencyjnych<ref name="Heller2013">{{cytuj|tytuł=InChI – the worldwide chemical structure identifier standard |autor=Stephen Heller, Alan McNaught, Stephen Stein, Dmitrii Tchekhovskoi, Igor Pletnev |czasopismo=Journal of Cheminformatics |data=2013 |wolumin=5 |s=7 |doi=10.1186/1758-2946-5-7 |pmid=23343401 |pmc=PMC3599061 |język=en}}</ref>.
 
Idea utworzenia publicznie dostępnego standardu reprezentacji struktur chemicznych zrodziła się w NIST w 1999 i miała na celu powiązanie ze sobą związków chemicznych w różnych bazach danych zarządzanych przez NIST<ref name="Heller2013" /><ref name="InChI Trust">{{cytuj|url=http://web.archive.org/web/20180116110824/http://www.inchi-trust.org:80/about-the-inchi-trust/ |tytuł=About the InChI Trust |opublikowany=InChI Trust |język=en |data dostępu=2018-11-05}}</ref>. W 2000 roku IUPAC rozpoczęła pracę nad opracowaniem nowego sposobu opisu substancji chemicznych, który w przeciwieństwie do [[nomenklatura chemiczna|nazewnictwa chemicznego]], mógłby być stosowany zarówno w publikacjach papierowych, jak i w systemach informatycznych (mógłby być odczytywany maszynowo). Założeniami nowego identyfikatora była możliwość generowania go na podstawie powszechnie stosowanych zasad przedstawiania struktur chemicznych opracowanych przez IUPAC i przy użyciu publicznie dostępnego ([[otwarte oprogramowanie|''open source'']]) algorytmu oraz niezależność od jakiejkolwiek bazy danych struktur chemicznych. Innymi słowy, dwustronna konwersja pomiędzymiędzy strukturą chemiczną a identyfikatorem mogłaby być dokonana przez każdego użytkownika<ref name="Heller2013" />. Projekt utworzenia nowego identyfikatora substancji chemicznych oficjalnie rozpoczął się z początkiem 2001, przy współpracy IUPAC, NIST i wielu innych podmiotów. W 2009 został utworzony InChI Trust, brytyjska organizacja non-profit, której zadaniem jest wspieranie i rozwijanie standardu InChI<ref name="Heller2013" />, a której członkami są zarówno przedsiębiorstwa związane z branżą chemiczną, jak i instytucje publiczne czy organizacje chemiczne<ref name="InChI Trust" />.
 
Pierwsza wersja (1.00) InChI została opracowana w 2005, trzy lata później udostępniono InChIKey, [[funkcja skrótu|haszowaną]] wersję InChI, która ma zawsze tę samą liczbę znaków i jest łatwiejsza do użycia, na przykład przy wyszukiwaniu substancji chemicznych. Z uwagi na możliwość generowania różnych InChI dla takiej samej struktury (w zależności od pożądanego stopnia szczegółowości), w 2009 utworzono wersje standardowe InChI i InChIKey (oznaczane czasem jako StdInChI i StdInChIKey), które mają z góry ustalony poziom szczegółowości (tzn. z danej struktury chemicznej zostanie wygenerowany zawsze taki sam identyfikator). Najnowszą wersję (1.05; stan na listopad 2018) opublikowano w 2017, wraz z RInChI (identyfikatorami dla reakcji chemicznych)<ref name="InChI Trust" />, jednak wiele projektów związanych z rozszerzeniem zakresu InChI (m.in. na [[mieszanina|mieszaniny]], [[związki nieorganiczne]] i [[związki metaloorganiczne|metaloorganiczne]], [[biomolekuła|biomolekuły]], [[tautomeria|tautomery]], [[rotaksany]], [[struktura Markusha|struktury Markusha]] czy zastosowanie [[kod QR|kodów QR]] dla InChI) jest wciąż nieukończonych<ref name="Heller2017">{{cytuj|tytuł=InChI Trust Project Director’s Report |autor=Steve Heller |data=2017-07 |opublikowany=InChI Trust |język=en |data dostępu=2018-11-05 |url=http://web.archive.org/web/20181105193923/https://www.inchi-trust.org/wp/wp-content/uploads/2017/10/InChITrust-Newsletter-July-2017.pdf}}</ref>.
Linia 13:
 
Podstawą InChI jest pewien rdzeń strukturalny, tj. struktura bez określonej tautomerii i stereochemii, o naturalnym składzie izotopowym i w stanie neutralnym. Na identyfikator składa się kilka warstw i podwarstw informacji, z których każda określa dany aspekt struktury chemicznej; przedstawiana struktura jest więc pochodną rdzenia strukturalnego o cechy wskazane przez kolejne warstwy i podwarstwy informacji. Możliwe jest generowanie identyfikatorów z określonym poziomem szczegółowości (np. bez rozróżnienia tautomerów), a więc w efekcie otrzymanie różnych InChI dla takiej samej struktury chemicznej. Z tego powodu istnieje również standardowy InChI – identyfikator, który generowany jest zawsze w identyczny sposób, bez względu na preferencje użytkownika, a więc stanowi identyfikator unikalny dla danej struktury chemicznej. Identyfikatory takie rozpoczynają się od prefiksu <code>InChI=1S/</code> zamiast <code>InChI=1/</code>. Kolejne warstwy i podwarstwy oddzielane są za pomocą ukośnika <code>/</code>. Po prefiksie następuje pierwsza warstwa informacji będąca [[symbolika chemiczna|wzorem sumarycznym]]. Następnie umieszczone są kolejne warstwy, z których część może nie występować w danym identyfikatorze, jeżeli nie ma znaczenia dla danej struktury chemicznej:
* <code>/c</code> – połączenia pomiędzymiędzy atomami tworzącymi strukturę cząsteczki
* <code>/h</code> – miejsca przyłączenia atomów wodoru
* <code>/q</code> – rozmieszczenie ładunków w cząsteczce