Wikiprojekt:Chemia/Wikidane
Wdrażaniem pobierania informacji z Wikidanych do polskojęzycznej Wikipedii zajmuje się projekt Wikidane, natomiast danymi z zakresu chemii w Wikidanych opiekuje się WikiProject Chemistry. W razie problemów merytorycznych z pobieranymi danymi, należy zgłosić sprawę w dyskusji projektu Chemia, a w przypadku problemów technicznych – w Kawiarence technicznej.
Informacje dotyczące treści chemicznych w Wikidanych
edytujEtykiety, opisy i inne nazwy
edytujW Wikidanych podstawową jednostką są elementy (items, oznaczane literą Q z numerem), której podstawowymi danymi są etykieta (label, główna nazwa elementu), opis (description, opis będący ujednoznacznieniem) i inne nazwy (aliases). Może istnieć wiele elementów o tej samej etykiecie bądź tym samym opisie, ale nie dwa elementy mające jednocześnie tę samą etykietę i opis.
W przypadku elementów związanych z chemią, wiele z nich nie ma etykiet i opisów w języku polskim bądź są one niepoprawne (duże/małe litery, pozostałości po przeniesieniach artykułów). Podobnie jest z innymi nazwami, w których często trafiają się wzory sumaryczne, numery (CAS, E) bądź nazwy nie odpowiadające w pełni tematowi elementu, a wyłącznie związane z nim (inne nazwy były importowane z Wikipedii na podstawie istniejących przekierowań).
Z reguły stosuje się następujące nazwy i opisy dla języka polskiego:
- związki chemiczne: etykietą jest nazwa związku chemicznego (przeważnie tożsama z nazwą artykułu), opisem – związek chemiczny, a inne nazwy są w miarę krótkimi nazwami alternatywnymi (zarówno systematycznymi, jak i tradycyjnymi), które mogą pomóc w wyszukaniu danego elementu (dla nazw systematycznych w przyszłości ma powstać odpowiednia właściwość).
- przykładowo pirol (Q242627) ma opis związek chemiczny oraz inne nazwy azol i 1H-pirol.
- pierwiastki chemiczne: etykietą jest nazwa pierwiastka, a opisem – pierwiastek chemiczny.
- grupy związków chemicznych: nie jest jeszcze ustalone, czy etykiety mają być w liczbie pojedynczej czy mnogiej oraz czy druga nazwa ma być podana jako inna nazwa.
Listy elementów mających artykuły w Wikipedii
edytujWłaściwość | Wartość | Listy | |
---|---|---|---|
jest to (P31) | związek chemiczny (Q11173) | 1, 2 | wszystkie elementy z artykułem w Wikipedii oznaczone jako związek chemiczny |
jest to (P31) | pierwiastek chemiczny (Q11344) | 1 | wszystkie elementy z artykułem w Wikipedii oznaczone jako pierwiastek chemiczny |
podklasa dla (P279) | związek chemiczny (Q11173) | 1 | wszystkie elementy z artykułem w Wikipedii oznaczone jako podklasa związek chemiczny |
podklasa dla (P279) | pierwiastek chemiczny (Q11344) | 1 | wszystkie elementy z artykułem w Wikipedii oznaczone jako podklasa pierwiastek chemiczny |
Listy elementów bez polskich etykiet lub opisów
edytujWłaściwość | Wartość | Listy | |
---|---|---|---|
jest to (P31) | związek chemiczny (Q11173) | etykieta, opis | wszystkie elementy bez etykiety/opisu oznaczone jako związek chemiczny (pierwsze 500) |
jest to (P31) | pierwiastek chemiczny (Q11344) | etykieta, opis | wszystkie elementy bez etykiety/opisu oznaczone jako pierwiastek chemiczny (pierwsze 500) |
podklasa dla (P279) | związek chemiczny (Q11173) | etykieta, opis | wszystkie elementy bez etykiety/opisu oznaczone jako podklasa związek chemiczny (pierwsze 500) |
podklasa dla (P279) | pierwiastek chemiczny (Q11344) | etykieta, opis | wszystkie elementy bez etykiety/opisu oznaczone jako podklasa pierwiastek chemiczny (pierwsze 500) |
Różnice pomiędzy Wikidanymi i Wikipedią
edytujNajpoważniejszą różnicą pomiędzy tymi projektami odnoszącą się do informacji chemicznych jest model danych, który nie odpowiada 1:1 strukturze artykułów w Wikipedii. Bardzo wyraźnymi przykładami są w tym przypadku hydraty i stereoizomery:
- W Wikipedii sól bezwodna i jej hydraty opisane są w jednym artykule (podobnie ich właściwości podane są w tym samym infoboksie); w Wikidanych sól bezwodna jest odrębnym elementem od każdego z hydratów. Artykuły w Wikipedii powiązane są z elementem dotyczącym soli bezwodnej.
- Stereoizomery najczęściej opisane są w Wikipedii w ramach jednego artykułu, w Wikidanych stanowią zaś osobne elementy. Przykładowo związek występujący w postaci dwóch enancjomerów R i S będzie opisany w postaci trzech lub czterech elementów w Wikidanych: (1) enancjomer R, (2) enancjomer S, (3) mieszanina racemiczna, (4) grupa izomerów. Artykuł w Wikipedii będzie powiązany prawdopodobnie z elementem (3) lub (4).
Podstawowe właściwości i kwalifikatory
edytujInformacje o elementach przechowywane są w postaci właściwości (properties) oraz kwalifikatorów (qualifiers). W obu przypadkach mają one odpowiednie wartości (values), które mogą być m.in. zwykłym tekstem, liczbą, datą, wartością z jednostką fizyczną bądź elementem w Wikidanych. Przykładowo:
- gęstość podawana jest poprzez właściwość gęstość (P2054) z wymaganymi kwalifikatorami temperatura (P2076) (wartość z jednostką temperatury) i stan skupienia (P515) (gdzie wartością może być gaz (Q11432), ciecz (Q11435), ciało stałe (Q11438) i kilka innych) oraz opcjonalnym kwalifikatorem ciśnienie (P2077) (wartość z jednostką ciśnienia).
- numer CAS podawany jest poprzez właściwość numer CAS (P231) bez dodatkowych kwalifikatorów.
Z punktu widzenia Wikipedii i możliwości sprawdzania zmian w importowanych danych ważne jest, aby każdy element dotyczący związku chemicznego miał właściwość jest to (P31) równą związek chemiczny (Q11173) (a dla pierwiastków pierwiastek chemiczny (Q11344)). Na tej relacji opiera się w tym momencie generowanie list pozwalających śledzić zmiany dla każdej z importowanych właściwości. Nie jest jeszcze ustalone w jaki sposób zrealizowana ma być bardziej szczegółowa klasyfikacja związków chemicznych.
Import informacji z Wikidanych
edytujCzęść informacji z Wikidanych może być pobierana bezpośrednio do artykułu, natomiast inne mogą służyć jedynie sprawdzeniu poprawności informacji wprowadzonych lokalnie. W każdym z przypadków generowana jest lista pozwalająca śledzić zmiany tych informacji w Wikidanych (lista aktualizowana jest raz dziennie). Dodatkowo dla każdej właściwości dodawana jest jedna z czterech kategorii technicznych (z podziałem na szablony, jeśli właściwość wykorzystywana jest w więcej niż jednym szablonie).
Lista szablonów
edytujSzablony wykorzystujące informacje z Wikidanych:
Lista właściwości
edytujWłaściwość | Parametr w szablonie | Lista | Kategorie | Uwagi |
---|---|---|---|---|
numer CAS (P231) | numer CAS |
listy: 1, 2 | kategorie | sprawdzanie ({{Związek chemiczny infobox}}) |
InChI (P234) | InChI |
listy: 1, 2 | kategorie | planowany import w {{Związek chemiczny infobox}} |
InChIKey (P235) | InChIKey |
listy: 1, 2 | kategorie | planowany import w {{Związek chemiczny infobox}} |
kategoria Commons (P373) | commons |
lista | kategorie | import ({{Pierwiastek infobox}} z nadpisywaniem wartości lokalnej, {{Preparat leczniczy infobox}}, {{Związek chemiczny infobox}} bez nadpisywania wartości lokalnej) |
identyfikator PubChem (CID) (P662) | PubChem |
listy: 1, 2 | kategorie | sprawdzanie ({{Związek chemiczny infobox}}) |
identyfikator DrugBank (P715) | DrugBank |
lista | kategorie | sprawdzanie ({{Związek chemiczny infobox}}) |
masa (P2067) | masa |
listy: 1, 2 | kategorie | wstrzymane do czasu wyjaśnienia rozbieżności ({{Związek chemiczny infobox}}) |
Informacje o kategoriach technicznych
edytujNazwa kategorii | Wyjaśnienie | Uwagi |
---|---|---|
Brak właściwości P... w Wikidanych | element w Wikidanych nie ma danej właściwości (odpowiadający jej parametr szablonu może ale nie musi być wypełniony w Wikipedii) |
|
Brak właściwości P... wpisanej lokalnie | w szablonie nie wypełniono parametru, ale odpowiadająca mu właściwość jest wypełniona w Wikidanych |
|
Właściwość P... inna niż wpisana lokalnie | wartość podana w Wikidanych jest różna od wartości podanej w szablonie |
|
Właściwość P... taka sama jak wpisana lokalnie | wartości w Wikidanych i w szablonie są takie same |
|
Lista zadań i informacje techniczne
edytujLista najważniejszych zadań
edytujDo zrobienia w Wikipedii
edytuj- Znalezienie ewentualnych przypadków, w których artykuł o związku chemicznym nie ma odpowiedniej właściwości P31 w Wikidanych.
- Zweryfikowanie wszystkich artykułów o związkach, w których pobierana kategoria Commons nie odpowiada treści artykułu, a następnie ustawienie nadpisywania właściwości pobieranej z Wikidanych przez parametr lokalny.
- Wprowadzenie pobierania kategorii Commons w {{Białko infobox}}, {{Minerał infobox}}, {{Analiza chemiczna infobox}}
- Konsultacje w sprawie maksymalnego zautomatyzowania {{Minerał infobox}} (brak aktywności, poprawiania, weryfikacji danych w zakresie tego infoboksu)
Historia zmian
edytuj- 2016-09: wprowadzenie pobierania kategorii Commons w {{Pierwiastek infobox}}
- W większości infoboksów podmienione zostały odnośniki do galerii na odnośniki do kategorii, w kilku przypadkach uzupełniony został brakujący odnośnik do Commons.
- 2017-03: wprowadzenie pobierania kategorii Commons w {{Związek chemiczny infobox}} i {{Preparat leczniczy infobox}}; utworzenie automatycznych list do sprawdzania w Wikidanych zmian w zakresie pobieranych właściwości.
- 2017-11: wprowadzenie sprawdzania poprawności identyfikatora DrugBank w {{Związek chemiczny infobox}}.
- 2017:12: wprowadzenie sprawdzania poprawności numeru CAS (pierwszego wpisanego w parametrze) i identyfikatora PubChem (pierwszego wpisanego w parametrze) w {{Związek chemiczny infobox}}; próba wprowadzenia sprawdzania masy molowej w {{Związek chemiczny infobox}} (nieudana, wartości masy dla związków chemicznych nie odpowiadają masie molowej).