テキストの抽出

PDF ドキュメントからテキスト コンテンツを抽出する

ここに PDF ファイルをドロップするか、クリックしてアップロードします

ここに PDF ファイルをドロップします

ファイルが大きすぎます (最大 100MB)

PDFはプレーンテキスト/TXTになるまでが壁

PDF は見やすいですが、RFP の長い引用、データのクリーンアップ、翻訳の準備、または再入力せずに貼り付ける必要がある引用など、必要な単語が閉じ込められる可能性があります。抽出は、通常のテキスト ツールへの橋渡しです。テキストのコピーは、PDF からオフィスの他の部分への橋渡しとなります。電子メールでの引用、RFP の回答、後で誰かが公の場で読むため正確である必要がある小さな編集などです。スキャンの場合、OCR も問題の一部であり、スペル チェッカーはコンプライアンス担当者ではないため、ケース ID のサイレント 3 が 8 に変わってしまうことを防ぐために、注意深く読むことが依然としてオフィスの習慣になっています。抽出したテキストを新しい公式文書にする必要がある場合、多くのチームは編集のために PDF を Word に変換します。最終成果物がまだ PDF である場合は、新しいエクスポートがきれいに送信されるように PDF を電子メール用に圧縮することもできることを覚えておいてください。領収書をアップロードするフィールド ワーカー、論文パケットを提出するホーム オフィスの学生、そして依然として変更指示の承認を得なければならないプロジェクト マネージャーを想像してみてください。肩書きは異なりますが、時間のプレッシャーは同じです。領収書をアップロードするフィールド ワーカー、論文パケットを提出するホーム オフィスの学生、そして依然として変更指示の承認を得なければならないプロジェクト マネージャーを想像してみてください。肩書きは異なりますが、時間のプレッシャーは同じです。確信が持てない場合は、金銭、署名、コンプライアンスに関する文言など、重要なページをいくつかプレビューしてください。これらのページは、ストレスが高いときにズームするページだからです。メールボックスの制限が厳しい場合、1 回のハンドオフで PDF をオンラインで無料で結合したり、スレッドがバウンスしたときに PDF を電子メール用に圧縮したり、再構築よりクイック編集の方が速い場合に PDF を Word に変換したり、リモートの承認者が連署を待っているときに PDF にオンラインで署名したりできることを知っておくと役立ちます。

実用的な方法で PDF をプレーンテキスト/TXT に変換します

  1. ソース PDF のコピーを保存し、変換を実行して、新しいプレーン テキスト/TXT を新しいファイル名で保存します。これにより、誤って古いソースと新しいソースが混在することがなくなります。
  2. テキストを開き、段落記号をオンにして、コンバーターが発明した暴走改行、フローティング ボックス、および奇妙なセクション区切りを探します。
  3. 外部共有のために PDF に再エクスポートします。クライアントが正確なレイアウトの忠実度を必要とする場合は、PDF とプレーン テキスト/TXT は異なる成果物であるため、変更内容についてのメモも送信します。

FAQ: PDF をプレーンテキスト / TXT に変換する

私のフォントは同じに見えるでしょうか?
PDF の埋め込みフォントとテキストで使用可能なフォントが一致することが保証されていないため、常にそうとは限りません。そのため、ブランド ドキュメントのテキストでクイック フォント パスが必要になる場合があります。
パスワードで保護された PDF はどうなるでしょうか?
コンバーターはビューアーが読み取ることができるコンテンツのみを読み取ることができるため、パスワードまたはクリアされたコピーが必要になります。
画像を鮮明に保つことはできますか?
多くのコンバーターは画像を持ち込んでいますが、特にクライアントが手を加えたパンフレットを再印刷する場合は、写真と線画の解像度を確認してください。
More versions