OCRとは?
OCR (光学式文字認識) は実際にはテキスト認識です。これは、画像 (JPG、PNG、BMP など) や PDF などの非テキスト形式のドキュメントからテキストを認識して抽出するソフトウェア プロセスです。画像内のテキストを「読み取る」機能、つまり単語の画像を実際のテキスト文字に変換する機能があります。これにより、ユーザーは、テキストを手動で転記するのではなく、ドキュメント内の元のテキストを簡単にコピーまたは編集できます。
光学式文字認識はどのように機能しますか?
光学式文字認識は通常、画像の彩度を下げてコントラストを付け、暗い領域と明るい領域のコントラストを最適化することで、画像を前処理します。したがって、黒いものはすべて文字と見なされ、白いものはそれらの文字の背景と見なされます。次に、パターン認識アルゴリズムと特徴検出を含むその他の方法を使用して、画像内のテキストの視覚的構造 (段落、行、文、単語などから 1 文字まで) を認識します。これらのプロセスでは現在、多くの場合、さまざまなフォント、サイズ、言語のテキストを含む何千もの画像で練習することにより、画像内のテキストを認識することを学習できる人工知能が使用されています。
OCR を使用する利点は何ですか?
光学式文字認識を使用する利点は、明らかに、画像内のテキストをデジタル化する時間を節約できることです。本からテキストを手動で再入力するのにかかる時間と、本をスキャンし、数秒でテキストを抽出できる OCR ソフトウェアでスキャンを処理する時間を比較してください。
ファイルの処理方法
選択したファイルは、OCR を実行するために、インターネット経由で当社のサーバーに送信されます。
サーバーに送信されたファイルは、変換が完了または失敗した後、すぐに削除されます。
HTTPS 暗号化は、ファイルを送信するとき、およびそれらのファイルから抽出されたテキストをダウンロードするときに使用されます。
このオンライン アプリは完全に Web ブラウザーに基づいており、ソフトウェアのインストールは必要ありません。
この無料アプリは、登録なしで何度でも使用できます。
携帯電話、タブレット、デスクトップ コンピューターなど、Web ブラウザーを備えたあらゆるデバイスで動作します。