OCR ツール — 画像・PDF・スキャンからテキスト抽出、オンラインで無料

光学文字認識（OCR）は物理文書と編集可能テキストの架け橋であり、最もしばしばペイウォールやアップロードフォームで詰まる作業です。Ai2Done の OCR Tools ハブはサイト上のすべての OCR 系ユーティリティを集めます — 写真、スキャン PDF、スクリーンショット、さらには大型 PDF 内の埋め込み画像からの抽出 — そしてすべて本地実行することで、パスポートスキャン、ID カード、医療記録、機密契約をアップロードする必要をなくします。

主役は 画像からテキスト ツールです。看板、文書、ホワイトボード、領収書の写真を投じ、数秒で編集可能テキストを受け取ります。エンジンは WebAssembly にコンパイルされた Tesseract 派生モデルで、英、中（簡・繁）、西、仏、独、日、韓、アラビア語など 100 言語以上をサポートします。多くのスクリプトで言語自動検出、混在文書では明示選択も可能です。

PDF は テキスト抽出 ツールが扱います。テキスト層付き PDF（テキストが既にエンコード済）とスキャン PDF（各ページが画像で OCR が必要）の両方に対応。スキャンの場合は典型的なノート PC で 1 ページあたり数秒、テキスト層付きなら結果は瞬時です。補完的な 画像抽出 ツールは PDF 内の全埋め込み画像を取り出して別途処理・アーカイブできます。3 つを組み合わせれば「非テキストソースからテキストを取る」ほぼ全ワークフローをカバーします。

OCR の精度は入力品質に強く依存します。シャープなスキャン、良好な照明、遠近歪みなし、300 DPI 以上が役立ちます。雑然とした背景に斜めに撮ったスマホ写真が最も困難です。出力は既定で平文、コピー、TXT 保存、整形編集のため Word への貼付が可能です。PDF は PDF Converter ハブ経由で Word に変換でき、可能な限り見出し階層を保ちます。

プライバシーは構造的な優位です。主要 SaaS OCR は画像を GPU クラスタにアップロードします。機密文書（HR 記録、医療報告、法的証拠、ID コピー）でその露出はしばしば許容できません。Ai2Done のパイプラインはブラウザサンドボックス内で完結 — 画像は読み込まれ、Wasm で処理され、テキストが返るだけでネットワークに触れません。OCR ハブは PDF Tools ハブ（抽出後テキストの加工）と Image Tools ハブ（OCR 前の前処理：圧縮、傾き補正、コントラスト）と組み合わせると効果的です。