Kas ir OCR?
OCR (optiskā rakstzīmju atpazīšana) faktiski ir teksta atpazīšana. Tas ir programmatūras process, kas atpazīst un izvelk tekstu no dokumentiem ne-teksta formātos, piemēram, attēliem (JPG, PNG, BMP utt.) un PDF failiem. Tam ir iespēja “lasīt” tekstu attēlos, citiem vārdiem sakot, pārvērst vārda attēlu tā faktiskajās teksta rakstzīmēs. Tas ļauj lietotājam viegli kopēt vai rediģēt dokumentu oriģinālo tekstu, nevis manuāli pārrakstīt tekstu.
Kā darbojas rakstzīmju optiskā atpazīšana?
Optiskā rakstzīmju atpazīšana parasti veic attēla priekšapstrādi, padarot to piesātinātu un kontrastējot, lai optimizētu kontrastu starp tumšajiem un gaišajiem apgabaliem. Tādējādi viss melnais tiek uzskatīts par rakstzīmēm, un tas, kas ir balts, tiek uzskatīts par šo rakstzīmju fonu. Pēc tam tiek izmantoti modeļu atpazīšanas algoritmi un citas metodes, tostarp pazīmju noteikšana, lai atpazītu attēla teksta vizuālo struktūru: no rindkopām, rindiņām, teikumiem, vārdiem un tā tālāk līdz atsevišķām rakstzīmēm. Šajos procesos tagad bieži tiek izmantots mākslīgais intelekts, kas var iemācīties atpazīt tekstu attēlā, praktizējot tūkstošiem attēlu ar tekstu dažādos fontos, izmēros un valodās.
Kādas ir OCR izmantošanas priekšrocības?
Optiskās rakstzīmju atpazīšanas izmantošanas priekšrocība acīmredzami ir laiks, ko tā ietaupa, digitalizējot tekstu attēlos. Salīdziniet laiku, kas nepieciešams, lai manuāli pārrakstītu tekstu no grāmatas līdz grāmatas skenēšanai un skenēto attēlu apstrādei ar OCR programmatūru, kas var izvilkt tekstu dažu sekunžu laikā.
Kā mēs apstrādājam jūsu failus
Jūsu atlasītie faili internetā tiek nosūtīti uz mūsu serveriem, lai tiem veiktu OCR.
Faili, kas nosūtīti uz mūsu serveriem, tiek nekavējoties dzēsti pēc konvertēšanas pabeigšanas vai neveiksmes.
HTTPS šifrēšana tiek izmantota, sūtot failus un lejupielādējot no šiem failiem izvilkto tekstu.
Šī tiešsaistes lietotne pilnībā atrodas jūsu tīmekļa pārlūkprogrammā, nav nepieciešama programmatūras instalēšana.
Varat izmantot šo bezmaksas lietotni tik reižu, cik vēlaties, bez reģistrācijas.
Tas darbojas jebkurā ierīcē, kurā ir tīmekļa pārlūkprogramma, tostarp mobilajos tālruņos, planšetdatoros un galddatoros.