Was ist OCR?
OCR (Optical Character Recognition) ist eine Texterkennung. Es handelt sich um einen Softwareprozess, der Text aus Dokumenten in Nicht-Textformaten wie Bildern (JPG, PNG, BMP usw.) und PDFs erkennt und extrahiert. Es hat die Fähigkeit, den Text in Bildern zu „lesen“, also das Bild eines Wortes in seine eigentlichen Textzeichen umzuwandeln. Dies ermöglicht es einem Benutzer, den Originaltext in Dokumenten einfach zu kopieren oder zu bearbeiten, anstatt den Text manuell transkribieren zu müssen.
Wie funktioniert die optische Zeichenerkennung?
Die optische Zeichenerkennung verarbeitet ein Bild typischerweise vor, indem es entsättigt und kontrastiert wird, um den Kontrast zwischen den dunklen und hellen Bereichen zu optimieren. Alles, was schwarz ist, wird dabei als Zeichen betrachtet, und alles, was weiß ist, wird als Hintergrund für diese Zeichen betrachtet. Dann werden Mustererkennungsalgorithmen und andere Verfahren einschließlich Merkmalserkennung verwendet, um die visuelle Struktur des Textes im Bild zu erkennen: von Absätzen über Zeilen, Sätze, Wörter und so weiter bis hin zu einzelnen Zeichen. Diese Prozesse verwenden heute häufig künstliche Intelligenz, die lernen kann, Text in Bildern zu erkennen, indem sie an Tausenden von Bildern mit Text in verschiedenen Schriftarten, Größen und Sprachen üben.
Welche Vorteile hat die Verwendung von OCR?
Der Vorteil der optischen Zeichenerkennung liegt offensichtlich in der Zeitersparnis beim Digitalisieren des Textes in Bildern. Vergleichen Sie die Zeit, die benötigt wird, um den Text manuell aus einem Buch neu einzugeben, mit dem Scannen des Buchs und der Verarbeitung der Scans mit einer OCR-Software, die den Text in Sekundenschnelle extrahieren kann.
Wie wir mit Ihren Dateien umgehen
Die von Ihnen ausgewählten Dateien werden über das Internet an unsere Server gesendet, um darauf eine OCR durchzuführen.
Die an unsere Server gesendeten Dateien werden nach Abschluss oder Fehlschlagen der Konvertierung unverzüglich gelöscht.
Beim Senden Ihrer Dateien und beim Herunterladen des aus diesen Dateien extrahierten Textes wird HTTPS-Verschlüsselung verwendet.
Diese Online-App basiert vollständig auf Ihrem Webbrowser, es ist keine Softwareinstallation erforderlich.
Sie können diese kostenlose App ohne Registrierung so oft verwenden, wie Sie möchten.
Es funktioniert auf jedem Gerät, das über einen Webbrowser verfügt, einschließlich Mobiltelefonen, Tablets und Desktop-Computern.