※本ページにはプロモーション(広告)が含まれています
画像やスキャン文書に写り込んだ文字を認識してテキストデータに変換する技術。Windows 11標準のSnipping ToolやmacOSの「テキスト認識表示」などに内蔵されている。
詳しい解説
OCR(Optical Character Recognition:光学文字認識)とは、カメラや画面キャプチャで取得した画像の中に含まれる文字を、コンピュータが認識してコピー・検索・編集できるテキストデータに変換する技術です。
歴史的には紙の書類をスキャンしてデジタル化する用途が中心でしたが、近年はスマートフォンのカメラアプリ、PC内蔵の画面キャプチャツール、クラウドドキュメントサービスなどに標準機能として組み込まれ、日常的に使われる技術になっています。
Windowsでは「Snipping Tool(切り取り & スケッチ)」のテキスト抽出機能がOCRを利用しており、選択した画面領域のテキストをワンクリックでクリップボードにコピーできます。macOSでは「テキスト認識表示」として写真・プレビュー・カメラアプリ全体でOCRが利用可能です。
OCRの認識精度は言語・フォント・解像度・背景色などに依存します。日本語は英語に比べて文字種が多く(ひらがな・カタカナ・漢字・英数字)、認識が難しい言語の一つです。特に縦書き、手書き文字、装飾フォントは認識精度が下がりやすいため、認識結果は必ず目視確認することが推奨されます。
よくあるトラブルは「コピーした日本語が文字化けする」「記号や句読点が欠落する」「行の区切りがおかしい」などです。文字化けの場合はシステムの言語設定をUTF-8または日本語に変更することで改善するケースが多くあります。
代表的なOCRエンジンには、Google Cloud Vision API、Microsoft Azure AI Vision、TesseractOCR(オープンソース)などがあります。精度重視のビジネス用途にはクラウドAPIが、プライバシー重視のオフライン用途にはTesseractが使われます。
スキャンしたPDFの請求書をWordに貼り付けたら画像のままで文字を編集できなかった場面で、OCRツールにかけると金額・日付・品目を自動でテキスト化してくれます。Windows 11では「Snipping Tool」で画面をキャプチャし、「テキスト抽出」ボタンを押すだけでそのままクリップボードに日本語テキストがコピーされます。ただし縦書きのPDFや手書き文字は文字化けしやすいため、Googleドキュメントの「画像からテキストを取得」機能など精度の高いクラウドOCRを併用するのが現実的です。
別の呼び方
テキスト認識
文字認識技術
テキスト抽出
minto.tech スマホ(Android/iPhone)・PC(Mac/Windows)の便利情報をお届け! 月間アクセス160万PV!スマートフォン、タブレット、パソコン、地デジに関する素朴な疑問や、困ったこと、ノウハウ、コツなどが満載のお助け記事サイトはこちら!