Optyczne rozpoznawanie znaków: Różnice pomiędzy wersjami
[wersja nieprzejrzana] | [wersja przejrzana] |
Usunięta treść Dodana treść
m przykład aplikacji |
|||
Linia 1:
'''OCR''' ([[Język angielski|ang.]] ''Optical Character Recognition'') – zestaw technik lub [[oprogramowanie]] służące do rozpoznawania znaków i całych tekstów w [[plik]]u [[Grafika komputerowa|graficznym]] o postaci [[Grafika rastrowa|rastrowej]]. Zadaniem OCR jest zwykle rozpoznanie tekstu w [[Skaner|zeskanowanym]] dokumencie (np. papierowym formularzu lub stronie książki).
Niegdyś termin oznaczał samo rozpoznawanie ciągów znaków, głównie drukowanych, które są łatwiejsze do rozpoznania, dziś również pisma odręcznego oraz cech [[
Techniki OCR wykorzystywane są m.in. przy [[Digitalizacja (bibliotekarstwo)|digitalizacji]] zasobów [[Biblioteka|bibliotek]], a także jako ułatwienie przy odczytywaniu danych z formularzy wypełnianych pismem odręcznym. W obu przypadkach oprogramowanie OCR nie jest tak skuteczne jak człowiek, zatem w przypadkach wątpliwych (trudności z odczytaniem fragmentu) oraz w celu uniknięcia błędów nieodzowna jest weryfikacja wyniku OCR przez człowieka.
Linia 10:
Rozpoznawanie pisma jest możliwe dzięki zastosowaniu metod z dziedziny [[Rozpoznawanie wzorców|rozpoznawania wzorców]] zaliczanej do [[Sztuczna inteligencja|sztucznej inteligencji]]. Oprogramowanie OCR wykorzystuje różne metody [[Segmentacja obrazu|segmentacji obrazu]], np. [[Progowanie obrazu|progowanie]], aby wyodrębnić poszczególne znaki z obrazu, które następnie są najczęściej osobno klasyfikowane jako poszczególne litery. Zwykle w tym procesie wykorzystywane są [[Sieć neuronowa|sieci neuronowe]]. Zazwyczaj, by wyeliminować pomyłki, program sprawdza całość rozpoznanego tekstu lub poszczególne wyrazy pod kątem poprawności ortograficznej i gramatycznej danego języka.
{{Commonscat|Optical character recognition}}
{{Przypisy}}
|