Optické rozpoznávání znaků

technologie převodu dokumentu z digitální obrazové do textové podoby pomocí metody optického rozpoznávaní znaků
Na tento článek je přesměrováno heslo OCR. O překážkovém závodu pojednává článek Obstacle course racing.
Možná hledáte: OCr nebo OČR.

Optické rozpoznávání znaků či OCR (z anglického Optical Character Recognition) je metoda, která pomocí scanneru umožňuje digitalizaci tištěných textů, s nimiž pak lze pracovat jako s normálním počítačovým textem. Počítačový program převádí obraz buď automaticky, nebo se musí naučit rozpoznávat znaky. Převedený text je téměř vždy v závislosti na kvalitě předlohy třeba podrobit důkladné korektuře, protože OCR program nemusí rozeznat všechna písmena správně. OCR – zpracování textu z tištěné do elektronické podoby je použitelné pro všechny tištěné výstupy z laserových, inkoustových, termosublimačních a jehličkových tiskáren a samozřejmě pro předlohy vytištěné knihtiskem. U nevhodných předloh, např. slabě vytištěných jehličkových výtisků nebo dohromady slitých písmen, se z časového hlediska vyplatí spíše přepis textu.

OCR algoritmus, detekce hran

Pro snadné rozpoznávání znaků byly vyvinuty strojově čitelné fonty, např. OCR-A, nebo dnes používanější OCR-B.

OCR software

JménoLicenceOperační systémPoznámky
ABBYY FineReader OCRKomerčníMicrosoft Windows Vista, Microsoft Windows Server 2003, Windows XP, Windows 2000 (SP2)..
Adobe AcrobatKomerčníWindows, macOS
PDF-XChange ViewerFreewareWindows
PDF-XChange Viewer ProKomerčníWindows
GOCRGPL(open source)
Microsoft Office Document ImagingKomerčníWindows, macOS
NovoDynamics VERUSKomerční??
OcradGPLUnix-like, OS/2
OCRopusApacheLinux
OmniPageKomerční (Nuance EULA)WindowsProdukt Nuance Communications
ReadirisKomerčníWindows, Mac OSProdukt I.R.I.S.
ReadSoftKomerční?
SimpleOCRFreeware a komerčníWindows
SmartScoreKomerčníWindows, Mac
TesseractApacheWindows, macOS, Linux, OS/2Vyvíjeno Googlem
Nicomsoft OCRKomerčníWindows, Linux

OCR rozpoznávající ručně psané znaky

Koncem 60. let 20. století byly v Japonsku vyvinuty OCR systémy rozeznávající i rukou psané znaky, především číslice (poštovní směrovací čísla).[1] Zařízení různých výrobců, ve kterých jsou tato OCR integrována, slouží v poštovním provozu k automatickému třídění dopisů.[2]

Reference

Externí odkazy