Co je OCR?
OCR (optické rozpoznávání znaků) je ve skutečnosti rozpoznávání textu. Jedná se o softwarový proces, který rozpoznává a extrahuje text z dokumentů v netextových formátech, jako jsou obrázky (JPG, PNG, BMP atd.) a PDF. Má schopnost „číst“ text v obrázcích, jinými slovy převádět obrázek slova na jeho skutečné textové znaky. To umožňuje uživateli snadno kopírovat nebo upravovat původní text v dokumentech, na rozdíl od nutnosti ručně přepisovat text.
Jak funguje optické rozpoznávání znaků?
Optické rozpoznávání znaků obvykle předzpracuje obraz desaturací a kontrastem, aby se optimalizoval kontrast mezi tmavými a světlými oblastmi. Vše, co je černé, je tedy považováno za znaky a to, co je bílé, je považováno za pozadí těchto znaků. Algoritmy rozpoznávání vzorů a další metody včetně detekce prvků se pak používají k rozpoznání vizuální struktury textu v obrázku: od odstavců přes řádky, věty, slova atd. až po jednotlivé znaky. Tyto procesy nyní často využívají umělou inteligenci, která se dokáže naučit rozpoznávat text v obraze tím, že cvičí na tisících obrázků s textem v různých fontech, velikostech a jazycích.
Jaké jsou výhody používání OCR?
Výhodou použití optického rozpoznávání znaků je samozřejmě časová úspora při digitalizaci textu v obrázcích. Porovnejte čas potřebný k ručnímu přepsání textu z knihy se skenováním knihy a zpracováním skenů pomocí softwaru OCR, který dokáže extrahovat text během několika sekund.
Jak nakládáme s vašimi soubory
Vybrané soubory jsou odesílány přes internet na naše servery, abychom na nich mohli provést OCR.
Soubory odeslané na naše servery jsou po dokončení nebo selhání převodu okamžitě smazány.
Při odesílání souborů a při stahování textu extrahovaného z těchto souborů se používá šifrování HTTPS.
Tato online aplikace je zcela založena ve vašem webovém prohlížeči, není nutná žádná instalace softwaru.
Tuto bezplatnou aplikaci můžete bez registrace používat tolikrát, kolikrát chcete.
Funguje na jakémkoli zařízení, které má webový prohlížeč, včetně mobilních telefonů, tabletů a stolních počítačů.