Optyczne rozpoznawanie znaków: Różnice pomiędzy wersjami

[wersja przejrzana][wersja przejrzana]
Usunięta treść Dodana treść
Anulowanie wersji 48879857 autora 155.133.0.16 (dyskusja)
Tashi (dyskusja | edycje)
Linia 1:
'''OCR''' ([[Język angielski|ang.]] ''Optical Character Recognition'') – zestaw technik lub [[oprogramowanie]] służące do rozpoznawania znaków i całych tekstów w [[plikPlik danych|pliku]]u [[Grafika komputerowa|graficznym]] o postaci [[Grafika rastrowa|rastrowej]]. Zadaniem OCR jest zwykle rozpoznanie tekstu w [[Skaner|zeskanowanym]] dokumencie (np. papierowym formularzu lub stronie książki).
 
Niegdyś termin oznaczał samo rozpoznawanie ciągów znaków, głównie drukowanych, które są łatwiejsze do rozpoznania, dziś również pisma odręcznego oraz cech [[formatFormatowanie dokumentów tekstowych|formatowania]]owania, jak [[krój pisma]], [[stopień pisma]], [[interlinia]] (techniki służące do tego typu zaawansowanego rozpoznawania nazywane są terminem [[ICR]]), a nawet [[Tabela|układów tabelarycznych]], np. formularzy.
 
Techniki OCR wykorzystywane są m.in. przy [[Digitalizacja (bibliotekarstwo)|digitalizacji]] zasobów [[Biblioteka|bibliotek]], a także jako ułatwienie przy odczytywaniu danych z formularzy wypełnianych pismem odręcznym. W obu przypadkach oprogramowanie OCR nie jest tak skuteczne jak człowiek, zatem w przypadkach wątpliwych (trudności z odczytaniem fragmentu) oraz w celu uniknięcia błędów nieodzowna jest weryfikacja wyniku OCR przez człowieka.