Rozpoznawanie pisma ręcznego

zagadnienie z dziedziny informatyki

Rozpoznawanie pisma ręcznego, rozpoznawanie pisma odręcznego, HWR (od ang. handwriting recognition) – zagadnienie z dziedziny sztucznej inteligencji polegające na odczytywaniu napisanych odręcznie tekstów z obrazu lub z urządzenia wejściowego. Innymi słowy, jest to przekształcanie tekstów odręcznych zapisanych w postaci graficznej do ciągu znaków (zakodowanych za pomocą, na przykład, unikodu)[1].

Nie należy mylić rozpoznawania pisma ręcznego z identyfikacją osoby piszącej (ang. handwriting identification), czym zajmuje się grafologia. W przypadku identyfikacji osoby piszącej należy skupić się na indywidualnych cechach pisma, pomijając treść tekstu, a w przypadku rozpoznawania pisma ręcznego odwrotnie: należy skoncentrować się na treści, pomijając cechy indywidualne[1].

Rozpoznawanie online i offline edytuj

Można wyróżnić dwa rodzaje rozpoznawania pisma ręcznego: online i offline. Rozpoznawanie online polega na odczytywaniu tekstu z urządzenia (np. z ekranu dotykowego) w trakcie jego pisania. Rozpoznawanie offline polega natomiast na odczytywaniu tekstu z obrazu (np. ze skanu). Rozpoznawanie online jest zagadnieniem prostszym, gdyż dostępna jest kolejność, w której powstawały kolejne fragmenty napisu[1].

Problemy edytuj

Przy analizie pisma ręcznego istnieje wiele problemów, które nie występują w tekstach drukowanych:

  • obecność łączonych liter[1]
  • stykające się linie tekstu[1]
  • różnice w charakterze pisma (np. nachylenie)[2].

Techniki edytuj

Do rozpoznawania pisma ręcznego wykorzystuje się między innymi sieci neuronowe, logikę rozmytą[3], ukryte modele Markowa[2].

Istnieje wiele różnych metod, ale można wskazać pewne typowe etapy algorytmów rozpoznających pismo ręczne. Na początku następuje tak zwany preprocessing, czyli binaryzacja (najczęściej progowanie), usuwanie szumów i tym podobne. Kolejnym etapem jest segmentacja, czyli wyodrębnienie poszczególnych liter. Ze względu na wymienione wcześniej problemy może to być trudne, zatem spotyka się również techniki polegające na wyodrębnianiu poszczególnych fragmentów liter lub wręcz przeciwnie – na wyodrębnianiu większych fragmentów tekstu (np. krótkich słów). Po tym etapie następuje rozpoznawanie liter i składanie ich w słowa. Często stosowane są metody korzystające ze zdefiniowanego wcześniej słownika[2][1].

Zobacz też edytuj

Przypisy edytuj

  1. a b c d e f R. Plamondon, S.N. Srihari, Online and off-line handwriting recognition: a comprehensive survey, „IEEE Transactions on Pattern Analysis and Machine Intelligence”, 22 (1), 2000, s. 63–84, DOI10.1109/34.824821.
  2. a b c A. Vinciarelli, A survey on off-line Cursive Word Recognition, „Pattern Recognition”, 25 (7), 2002, s. 1433–1446, DOI10.1016/S0031-3203(01)00129-7.
  3. W. Kacalak, M. Majewski, Wybrane problemy efektywnego rozpoznawania pisma odręcznego, „PAK”, 5, 2001, s. 479–482.