imagazin arrow2-left arrow2-right arrow2-top arrow-up arrow-down arrow-left arrow-right cart close dossiers education fb instagram menu notification oander rss rss-footer search service shuffle speech-bubble star store stores tests twitter youtube
iphone x

Kdy můžeme očekávat vydání bety iOS 12?

Podívali jsme se na tendence z posledních let

Jak funguje OCR?


Možná jste se již někdy setkali s potřebou převést vytištěný dokument do digitální podoby. Jestliže nemáte text v elektronické verzi, zbývají dvě cesty – buď vše poctivě přepíšete do počítače, nebo využijete OCR (Optical Character Recognition, česky jako optické rozpoznávání znaků). Dnes vám představíme, jak OCR funguje.

Většina našich dokumentů již v digitální podobě existuje, jednou z řady výhod je třeba možnost úprav. Vytváření kopie je ještě snadnější, pro vytisknutí pak stačí kliknout na klávesovou kombinaci CMD + P, a je to.

Obrátit tento proces je ale o něco složitější. Existují skenery, ale ty vytvářejí jen fotku jedné dobře osvícené stránky ve vysokém rozlišení. Ale co když chcete dokument časem upravit? Nejhorším scénářem je, že musíte text přepsat pěkně postaru. V lepším případě „there’s an app for that“.

Jak již bylo výše popsáno, OCR značí optické rozpoznávání znaků. Jak název napovídá, systém zvládne rozpoznat každý jeden znak zvlášť. Nemusí se to na první pohled zdát jako zásadní, ale opak je pravdou. Počet různých fontů je nekonečný a většina z nich skutečně není jednoduchých. Zejména proto, že pak rozdílné znaky vypadají velice podobně, pravděpodobnost prohození je vysoká.

Jak algoritmy tento problém řeší? Zaprvé musí vyřadit všechny faktory, které skenování narušují. Vzhledem k tomu, že základem pro rozpoznání je vlastně fotografie, musí systém rozpoznat, co je reálný text a co třeba jen různé skvrny na papíru. Software dělá pár kouzel jako v Photoshopu – upravuje kontrast, zvýrazňuje bílé části a černou dělá černější. To pomáhá rozpoznání jednotlivých částí.

Těžší krok však přichází až potom. Aplikace vytvoří části, obtáhne jednotlivé znaky a následně porovná tato obtažení s fonty, které zná. Mluvíme tu o porovnávání na úrovni pixelů. Pokročilejší softwary zvládnou zpracovat celé archy a vytvořit vektorové grafické modely, jež dále pomáhají s přesností.

Po tomto procesu přichází poslední krok – slovník. Jestliže jste někdy používali aplikaci fungující na OCR, museli jste prakticky vždy zvolit jazyk. Slovní zásoba aplikaci pomáhá rozhodnout, který z použitých znaků je ten správný.

Proces je jen málokdy zcela bezchybný, vždy se v textu objevují chybky. Rozhodně tak stojí za to zpracovaný dokument pročíst a zkontrolovat. Další zlepšování by však mohlo přinést strojové učení a umělá inteligence.

Nejpokročilejší software využívající OCR se nachází na poštách. Jde o tak kvalitní nástroje, že zvládnou rozpoznat i ručně psané písmo s neuvěřitelnou mírou přesnosti. Lidé přitom nepoužívají žádné „standardní fonty“.

Jestliže byste si rádi podobnou aplikaci vyzkoušeli, jsou tu kousky od Adobe či Abby. Obě společnosti své programy nabízejí jak pro Mac, tak iOS.

Zdroj: Techquickie

iMac Pro
Apple Inc. (AAPL)

Tohle už jste četli?

Nový systém se zaměřuje především na dvě oblasti: na uživatelský zážitek a na výkon. Z pohledu výkonu staví na novém frameworku Metal, který Apple již dříve přinesl na iOS. Metal kombinuje schopnosti technologií OpenGl a OpenCL do jednoho prvku.