Osadzanie słów

metoda przetwarzania języka naturalnego

Osadzanie słów[1][2], zanurzenie słów[3], reprezentacje właściwościowe słów[1] (ang. word embedding) – technika wykorzystywana w przetwarzaniu języka naturalnego, głównie w ramach sztucznych sieci neuronowych. Polega ona na kodowaniu słów za pomocą wektorów o wartościach liczbowych w taki sposób, żeby słowa o podobnym znaczeniu były reprezentowane przez wektory zbliżone do siebie w przestrzeni wektorowej[4][5].

Zobacz też

edytuj

Zanurzenie (matematyka)

Przypisy

edytuj
  1. a b Aurélien Géron, Uczenie maszynowe z użyciem Scikit-Learn i TensorFlow, Krzysztof Sawka (tłum.), Wydanie II, aktualizacja do modułu TensorFlow 2, Gliwice: Helion, 2020, s. 428, ISBN 978-83-283-6002-0 [dostęp 2024-06-24] (pol.).
  2. Paweł Rutkowski, Rozpoznawanie sentymentu w pisanym tekście [online], 2022 (pol.).
  3. Adrianna Klank, Jak pogodzić lingwistykę z informatyką? O dzieleniu słów w NLP, [w:] Zderzenia poznawcze. Księga abstraktów, 2021 (pol.).
  4. Dan Jurafsky, James H. Martin, Speech and language processing: an introduction to natural language processing, computational linguistics, and speech recognition, Prentice Hall series in artificial intelligence, Upper Saddle River, N.J: Prentice Hall, 2000, ISBN 978-0-13-095069-7 [dostęp 2024-05-26].
  5. Rafał Maciąg, Zaawansowane procedury NLP jako przesłanka rekonstrukcji idei wiedzy, „Zarządzanie w Kulturze”, 23 (1), 2022, s. 37–53, DOI10.4467/20843976ZK.22.003.15869 [dostęp 2024-05-26].