Optyczne rozpoznawanie znaków: Różnice pomiędzy wersjami

[wersja nieprzejrzana][wersja przejrzana]
Usunięta treść Dodana treść
Kmoscik (dyskusja | edycje)
m przykład aplikacji
Masur (dyskusja | edycje)
WP:SK, WP:ZWL, drobne techniczne
Linia 1:
'''OCR''' ([[Język angielski|ang.]] ''Optical Character Recognition'') – zestaw technik lub [[oprogramowanie]] służące do rozpoznawania znaków i całych tekstów w [[plik]]u [[Grafika komputerowa|graficznym]] o postaci [[Grafika rastrowa|rastrowej]]. Zadaniem OCR jest zwykle rozpoznanie tekstu w [[Skaner|zeskanowanym]] dokumencie (np. papierowym formularzu lub stronie książki).
 
Niegdyś termin oznaczał samo rozpoznawanie ciągów znaków, głównie drukowanych, które są łatwiejsze do rozpoznania, dziś również pisma odręcznego oraz cech [[Format|formatowaniaformat]]owania, jak [[krój pisma]], [[stopień pisma]], [[interlinia]] (techniki służące do tego typu zaawansowanego rozpoznawania nazywane są terminem [[ICR]]), a nawet [[Tabela|układów tabelarycznych]], np. formularzy.
 
Techniki OCR wykorzystywane są m.in. przy [[Digitalizacja (bibliotekarstwo)|digitalizacji]] zasobów [[Biblioteka|bibliotek]], a także jako ułatwienie przy odczytywaniu danych z formularzy wypełnianych pismem odręcznym. W obu przypadkach oprogramowanie OCR nie jest tak skuteczne jak człowiek, zatem w przypadkach wątpliwych (trudności z odczytaniem fragmentu) oraz w celu uniknięcia błędów nieodzowna jest weryfikacja wyniku OCR przez człowieka.
Linia 10:
Rozpoznawanie pisma jest możliwe dzięki zastosowaniu metod z dziedziny [[Rozpoznawanie wzorców|rozpoznawania wzorców]] zaliczanej do [[Sztuczna inteligencja|sztucznej inteligencji]]. Oprogramowanie OCR wykorzystuje różne metody [[Segmentacja obrazu|segmentacji obrazu]], np. [[Progowanie obrazu|progowanie]], aby wyodrębnić poszczególne znaki z obrazu, które następnie są najczęściej osobno klasyfikowane jako poszczególne litery. Zwykle w tym procesie wykorzystywane są [[Sieć neuronowa|sieci neuronowe]]. Zazwyczaj, by wyeliminować pomyłki, program sprawdza całość rozpoznanego tekstu lub poszczególne wyrazy pod kątem poprawności ortograficznej i gramatycznej danego języka.
 
== Przykłady oprogramowania OCR ==
* [[Adobe Acrobat|Adobe Acrobat Professional]] (Windows, Mac OS)
* [[BIT-Alpha]] (Windows)
* [[ExactScan Pro]] (Mac OS)
* [[FineReader]] (Unix, Windows)
* [[OCRKit]] (Mac OS)
* [[PDF-XChange Viewer]] (Windows)
* [[Readiris]] (Unix, Windows, Mac OS)
* [[OmniPage]] (Windows, Mac OS)
* [[Recognita]]
* [[SmartScan]]
* Nicomsoft OCR (Windows, Unix)
* [[Microsoft Office Document Imaging]] (Windows)
* [[MiceText OCR]] (Windows)
 
== Zobacz też ==
{{Commonscat|Optical character recognition}}
* [[OMR]]
* [[skład tekstu]]
* [[typografia]]
* [[rozpoznawanie mowy]]
 
{{Przypisy}}