Извлечь текст

Извлечение текстового содержимого из PDF-документов

Перетащите PDF-файл сюда или нажмите, чтобы загрузить.

Перетащите PDF-файл сюда

Файл слишком большой (максимум 100 МБ)

Таблица — это то, что все боятся перепечатывать

PDF-файл легко просматривать, но нужные слова могут быть захвачены: длинные кавычки для запросов предложений, очистка данных, подготовка к переводу или цитата, которую необходимо вставить, не печатая заново.Извлечение — это мост к обычным текстовым инструментам.Обычный текст — это лингва-франка скриптов, конвейеров и моментов, когда вам нужны только слова, а не идеальный макет для печати, для быстрого перехода к следующему этапу.Что касается сканирования, то оптическое распознавание текста является частью истории, и внимательное чтение по-прежнему является офисной привычкой, которая предотвращает превращение молчаливой 3 в 8 в идентификаторе дела, поскольку программа проверки орфографии не является специалистом по соблюдению требований.Когда извлеченный текст должен стать новым официальным документом, многие команды выполняют преобразование PDF в Word для редактирования, а когда конечный результат по-прежнему остается в формате PDF, помните, что вы также можете сжать PDF для отправки по электронной почте, чтобы новый экспорт прошел без проблем.Представьте себе полевого работника, загружающего квитанции, студента из домашнего офиса, отправляющего пакет диссертации, и менеджера проекта, которому все еще нужно утвердить приказ об изменении: разные названия, одинаковое количество времени.Представьте себе удаленного коллегу, который не может подойти к вашему столу, чтобы «просто открыть нужный», и вежливого, но занятого клиента;ваше имя файла и ваша файловая структура являются частью уважения, которое вы к ним проявляете.Если вы когда-либо не уверены, просмотрите несколько ключевых страниц, в том числе что-нибудь с деньгами, подписями или языком соответствия, потому что именно эти страницы люди масштабируют, когда стресс высок.Если следующим шагом в вашей повседневной жизни является жесткий лимит почтового ящика, полезно знать, что вы можете бесплатно объединять PDF-файлы онлайн для одной передачи, сжимать PDF-файл для электронной почты, когда ветка прерывается, конвертировать PDF-файл в Word, когда быстрое редактирование выполняется быстрее, чем перестроение, и подписывать PDF-файлы онлайн, когда удаленные утверждающие лица ждут контрассигнации.

Перемещайте таблицы PDF в текст с меньшим количеством ошибок

  1. В тексте включите отображение линий сетки и используйте свойства таблицы, чтобы увидеть границы, которые вы не видите, поскольку невидимые границы являются классическим источником неровных строк после преобразования.
  2. Скопируйте подозрительную строку в новую пустую таблицу, чтобы проверить, нет ли в стиле таблицы неправильных интервалов или проблемы с абзацем, скрывающейся внутри ячейки, а затем устраните основную проблему.
  3. Повторно экспортируйте PDF-файл и сравните итоговые значения и строки заголовков, особенно когда появляются деньги или единицы измерения, потому что небольшое изменение может быть проблемой бизнеса, а не проблемой стиля.

Часто задаваемые вопросы: PDF-таблицы в текст

Стоит ли использовать Excel вместо текста для таблиц?
Для сложных вычислений и сортировки перейдите в Excel;text — это то, что вам нужно, если таблица является частью повествования, которое вы также будете редактировать в абзацах.
Что делать, если таблица разделена на несколько страниц PDF-файла?
Осторожно соединяйте строки в тексте и следите за повторяющимися заголовками, поскольку в некоторых случаях в офисных PDF-файлах конвертер может дублировать строку заголовка как строку данных.
А как насчет ячеек таблицы с цветовой маркировкой рисков?
Затенение можно преобразовать в нечетные заливки;вы можете повторно применить условную заливку в тексте или перемаркировать важные строки в тексте, если цвет должен соответствовать требованиям доступности.
More versions