Wdrażaniem pobierania informacji z Wikidanych do polskojęzycznej Wikipedii zajmuje się projekt Wikidane, natomiast danymi z zakresu chemii w Wikidanych opiekuje się WikiProject Chemistry. W razie problemów merytorycznych z pobieranymi danymi, należy zgłosić sprawę w dyskusji projektu Chemia, a w przypadku problemów technicznych – w Kawiarence technicznej.

Informacje dotyczące treści chemicznych w Wikidanych

edytuj

Etykiety, opisy i inne nazwy

edytuj

W Wikidanych podstawową jednostką są elementy (items, oznaczane literą Q z numerem), której podstawowymi danymi są etykieta (label, główna nazwa elementu), opis (description, opis będący ujednoznacznieniem) i inne nazwy (aliases). Może istnieć wiele elementów o tej samej etykiecie bądź tym samym opisie, ale nie dwa elementy mające jednocześnie tę samą etykietę i opis.

W przypadku elementów związanych z chemią, wiele z nich nie ma etykiet i opisów w języku polskim bądź są one niepoprawne (duże/małe litery, pozostałości po przeniesieniach artykułów). Podobnie jest z innymi nazwami, w których często trafiają się wzory sumaryczne, numery (CAS, E) bądź nazwy nie odpowiadające w pełni tematowi elementu, a wyłącznie związane z nim (inne nazwy były importowane z Wikipedii na podstawie istniejących przekierowań).

Z reguły stosuje się następujące nazwy i opisy dla języka polskiego:

  • związki chemiczne: etykietą jest nazwa związku chemicznego (przeważnie tożsama z nazwą artykułu), opisem – związek chemiczny, a inne nazwy są w miarę krótkimi nazwami alternatywnymi (zarówno systematycznymi, jak i tradycyjnymi), które mogą pomóc w wyszukaniu danego elementu (dla nazw systematycznych w przyszłości ma powstać odpowiednia właściwość).
    przykładowo pirol (Q242627) ma opis związek chemiczny oraz inne nazwy azol i 1H-pirol.
  • pierwiastki chemiczne: etykietą jest nazwa pierwiastka, a opisem – pierwiastek chemiczny.
  • grupy związków chemicznych: nie jest jeszcze ustalone, czy etykiety mają być w liczbie pojedynczej czy mnogiej oraz czy druga nazwa ma być podana jako inna nazwa.

Listy elementów mających artykuły w Wikipedii

edytuj
Właściwość Wartość Listy
jest to (P31) związek chemiczny (Q11173) 1, 2 wszystkie elementy z artykułem w Wikipedii oznaczone jako związek chemiczny
jest to (P31) pierwiastek chemiczny (Q11344) 1 wszystkie elementy z artykułem w Wikipedii oznaczone jako pierwiastek chemiczny
podklasa dla (P279) związek chemiczny (Q11173) 1 wszystkie elementy z artykułem w Wikipedii oznaczone jako podklasa związek chemiczny
podklasa dla (P279) pierwiastek chemiczny (Q11344) 1 wszystkie elementy z artykułem w Wikipedii oznaczone jako podklasa pierwiastek chemiczny

Listy elementów bez polskich etykiet lub opisów

edytuj
Właściwość Wartość Listy
jest to (P31) związek chemiczny (Q11173) etykieta, opis wszystkie elementy bez etykiety/opisu oznaczone jako związek chemiczny (pierwsze 500)
jest to (P31) pierwiastek chemiczny (Q11344) etykieta, opis wszystkie elementy bez etykiety/opisu oznaczone jako pierwiastek chemiczny (pierwsze 500)
podklasa dla (P279) związek chemiczny (Q11173) etykieta, opis wszystkie elementy bez etykiety/opisu oznaczone jako podklasa związek chemiczny (pierwsze 500)
podklasa dla (P279) pierwiastek chemiczny (Q11344) etykieta, opis wszystkie elementy bez etykiety/opisu oznaczone jako podklasa pierwiastek chemiczny (pierwsze 500)

Różnice pomiędzy Wikidanymi i Wikipedią

edytuj

Najpoważniejszą różnicą pomiędzy tymi projektami odnoszącą się do informacji chemicznych jest model danych, który nie odpowiada 1:1 strukturze artykułów w Wikipedii. Bardzo wyraźnymi przykładami są w tym przypadku hydraty i stereoizomery:

  • W Wikipedii sól bezwodna i jej hydraty opisane są w jednym artykule (podobnie ich właściwości podane są w tym samym infoboksie); w Wikidanych sól bezwodna jest odrębnym elementem od każdego z hydratów. Artykuły w Wikipedii powiązane są z elementem dotyczącym soli bezwodnej.
  • Stereoizomery najczęściej opisane są w Wikipedii w ramach jednego artykułu, w Wikidanych stanowią zaś osobne elementy. Przykładowo związek występujący w postaci dwóch enancjomerów R i S będzie opisany w postaci trzech lub czterech elementów w Wikidanych: (1) enancjomer R, (2) enancjomer S, (3) mieszanina racemiczna, (4) grupa izomerów. Artykuł w Wikipedii będzie powiązany prawdopodobnie z elementem (3) lub (4).

Podstawowe właściwości i kwalifikatory

edytuj

Informacje o elementach przechowywane są w postaci właściwości (properties) oraz kwalifikatorów (qualifiers). W obu przypadkach mają one odpowiednie wartości (values), które mogą być m.in. zwykłym tekstem, liczbą, datą, wartością z jednostką fizyczną bądź elementem w Wikidanych. Przykładowo:

  • gęstość podawana jest poprzez właściwość gęstość (P2054) z wymaganymi kwalifikatorami temperatura (P2076) (wartość z jednostką temperatury) i stan skupienia (P515) (gdzie wartością może być gaz (Q11432), ciecz (Q11435), ciało stałe (Q11438) i kilka innych) oraz opcjonalnym kwalifikatorem ciśnienie (P2077) (wartość z jednostką ciśnienia).
  • numer CAS podawany jest poprzez właściwość numer CAS (P231) bez dodatkowych kwalifikatorów.

Z punktu widzenia Wikipedii i możliwości sprawdzania zmian w importowanych danych ważne jest, aby każdy element dotyczący związku chemicznego miał właściwość jest to (P31) równą związek chemiczny (Q11173) (a dla pierwiastków pierwiastek chemiczny (Q11344)). Na tej relacji opiera się w tym momencie generowanie list pozwalających śledzić zmiany dla każdej z importowanych właściwości. Nie jest jeszcze ustalone w jaki sposób zrealizowana ma być bardziej szczegółowa klasyfikacja związków chemicznych.

Import informacji z Wikidanych

edytuj

Część informacji z Wikidanych może być pobierana bezpośrednio do artykułu, natomiast inne mogą służyć jedynie sprawdzeniu poprawności informacji wprowadzonych lokalnie. W każdym z przypadków generowana jest lista pozwalająca śledzić zmiany tych informacji w Wikidanych (lista aktualizowana jest raz dziennie). Dodatkowo dla każdej właściwości dodawana jest jedna z czterech kategorii technicznych (z podziałem na szablony, jeśli właściwość wykorzystywana jest w więcej niż jednym szablonie).

Lista szablonów

edytuj

Szablony wykorzystujące informacje z Wikidanych:

Lista właściwości

edytuj
Właściwość Parametr w szablonie Lista Kategorie Uwagi
numer CAS (P231) numer CAS listy: 1, 2 kategorie sprawdzanie ({{Związek chemiczny infobox}})
InChI (P234) InChI listy: 1, 2 kategorie planowany import w {{Związek chemiczny infobox}}
InChIKey (P235) InChIKey listy: 1, 2 kategorie planowany import w {{Związek chemiczny infobox}}
kategoria Commons (P373) commons lista kategorie import ({{Pierwiastek infobox}} z nadpisywaniem wartości lokalnej, {{Preparat leczniczy infobox}}, {{Związek chemiczny infobox}} bez nadpisywania wartości lokalnej)
identyfikator PubChem (CID) (P662) PubChem listy: 1, 2 kategorie sprawdzanie ({{Związek chemiczny infobox}})
identyfikator DrugBank (P715) DrugBank lista kategorie sprawdzanie ({{Związek chemiczny infobox}})
masa (P2067) masa listy: 1, 2 kategorie wstrzymane do czasu wyjaśnienia rozbieżności ({{Związek chemiczny infobox}})

Informacje o kategoriach technicznych

edytuj
Nazwa kategorii Wyjaśnienie Uwagi
Brak właściwości P... w Wikidanych element w Wikidanych nie ma danej właściwości (odpowiadający jej parametr szablonu może ale nie musi być wypełniony w Wikipedii)
  • można sprawdzić, czy w szablonie podana jest informacja i skopiować ją do Wikidanych, jeżeli jest poprawna i uźródłowiona
Brak właściwości P... wpisanej lokalnie w szablonie nie wypełniono parametru, ale odpowiadająca mu właściwość jest wypełniona w Wikidanych
  • jeśli właściwość jest importowana: nie wymagane jest żadne działanie
  • jeśli właściwość jest sprawdzana: należy zweryfikować poprawność informacji w Wikidanych i skopiować ją do szablonu wraz ze źródłem
Właściwość P... inna niż wpisana lokalnie wartość podana w Wikidanych jest różna od wartości podanej w szablonie
  • należy sprawdzić, która informacja jest prawidłowa i odpowiednio poprawić ją w szablonie lub w Wikidanych
  • zdarza się jednak, że element w Wikidanych nie odpowiada tematowi artykułu w 100% i informacje w obu miejscach są prawidłowe – warto jednak zgłosić taki przypadek, bo możliwe jest, że linki do Wikipedii są umieszczone w nieprawidłowym elemencie w Wikidanych
Właściwość P... taka sama jak wpisana lokalnie wartości w Wikidanych i w szablonie są takie same
  • nie wymagane jest żadne działanie

Lista zadań i informacje techniczne

edytuj

Lista najważniejszych zadań

edytuj

Do zrobienia w Wikipedii

edytuj
  • Znalezienie ewentualnych przypadków, w których artykuł o związku chemicznym nie ma odpowiedniej właściwości P31 w Wikidanych.
  • Zweryfikowanie wszystkich artykułów o związkach, w których pobierana kategoria Commons nie odpowiada treści artykułu, a następnie ustawienie nadpisywania właściwości pobieranej z Wikidanych przez parametr lokalny.
  • Wprowadzenie pobierania kategorii Commons w {{Białko infobox}}, {{Minerał infobox}}, {{Analiza chemiczna infobox}}
  • Konsultacje w sprawie maksymalnego zautomatyzowania {{Minerał infobox}} (brak aktywności, poprawiania, weryfikacji danych w zakresie tego infoboksu)

Historia zmian

edytuj
  • 2016-09: wprowadzenie pobierania kategorii Commons w {{Pierwiastek infobox}}
    W większości infoboksów podmienione zostały odnośniki do galerii na odnośniki do kategorii, w kilku przypadkach uzupełniony został brakujący odnośnik do Commons.
  • 2017-03: wprowadzenie pobierania kategorii Commons w {{Związek chemiczny infobox}} i {{Preparat leczniczy infobox}}; utworzenie automatycznych list do sprawdzania w Wikidanych zmian w zakresie pobieranych właściwości.
  • 2017-11: wprowadzenie sprawdzania poprawności identyfikatora DrugBank w {{Związek chemiczny infobox}}.
  • 2017:12: wprowadzenie sprawdzania poprawności numeru CAS (pierwszego wpisanego w parametrze) i identyfikatora PubChem (pierwszego wpisanego w parametrze) w {{Związek chemiczny infobox}}; próba wprowadzenia sprawdzania masy molowej w {{Związek chemiczny infobox}} (nieudana, wartości masy dla związków chemicznych nie odpowiadają masie molowej).