텍스트 추출

PDF 문서에서 텍스트 내용 추출

여기에 PDF 파일을 놓거나 클릭하여 업로드하세요.

PDF 파일을 여기에 드롭하세요.

파일이 너무 큼(최대 100MB)

“레이아웃 유지”는 희망이자 과정입니다

PDF는 보기 쉽지만 RFP를 위한 긴 인용문, 데이터 정리, 번역 준비 또는 다시 입력하지 않고 붙여넣어야 하는 인용문 등 필요한 단어가 갇혀 있을 수 있습니다. 추출은 일반 텍스트 도구로 연결되는 다리입니다. 검색 가능한 텍스트는 소프트 초능력입니다. 하루가 이미 길어졌을 때 300페이지를 다시 읽지 않고도 긴 계약서에서 한 조항을 찾을 수 있습니다. 스캔의 경우 OCR은 이야기의 일부이며 철자 검사기는 규정 준수 담당자가 아니기 때문에 케이스 ID에서 무음 3이 8로 바뀌는 것을 방지하는 사무실 습관은 주의 깊게 읽는 것입니다. 추출된 텍스트가 새로운 공식 문서가 되어야 하는 경우 많은 팀에서는 편집을 위해 PDF를 Word 패스로 변환하고, 최종 결과물이 여전히 PDF인 경우 새 내보내기가 깔끔하게 전달되도록 이메일용 PDF를 압축할 수도 있다는 점을 기억하세요. 영수증을 업로드하는 현장 작업자, 논문 패킷을 제출하는 홈 오피스 학생, 변경 주문 승인을 받아야 하는 프로젝트 관리자를 생각해 보세요. 제목은 다르지만 시간 압박은 동일합니다. "올바른 책상을 열어보기" 위해 책상에 올 수 없는 원격 동료와 예의바르지만 바쁜 고객을 상상해 보십시오. 귀하의 파일 이름과 파일 구조는 귀하가 표시하는 존중의 일부입니다. 확실하지 않은 경우 돈, 서명 또는 규정 준수 언어가 포함된 몇 가지 주요 페이지를 미리 보십시오. 스트레스가 높을 때 사람들이 확대하는 페이지이기 때문입니다. 하루의 다음 단계가 사서함 제한이 빡빡한 경우 단일 핸드오프를 위해 온라인에서 무료로 PDF를 병합하고, 스레드가 반송될 때 이메일용 PDF를 압축하고, 빠른 편집이 다시 작성보다 빠를 때 PDF를 Word로 변환하고, 원격 승인자가 연대 서명을 기다리고 있을 때 온라인으로 PDF에 서명할 수 있다는 것을 아는 것이 도움이 됩니다.

텍스트로 이동하는 동안 PDF의 구조를 유지하세요

  1. 콘텐츠를 터치하기 전에 필요한 브랜드와 일치하도록 텍스트 기본 스타일을 설정하면 도시별로 지역적으로 조정하는 대신 제목 스타일을 대량으로 다시 적용할 수 있습니다.
  2. 이미지가 점프하는 경우 공백을 사용하여 이동하는 대신 의도적으로 앵커 및 줄 바꿈 옵션을 사용하십시오. 이는 누군가 개체 앞의 단락을 편집할 때 중단됩니다.
  3. 두 페이지 테스트 인쇄를 실행하십시오. 화면 교정은 고객 대상 작업 시 바닥글 규칙과 줄 간격이 종이에 유지된다는 것을 보장하지 않기 때문입니다.

FAQ: PDF에서 텍스트로 검색 가능하고 선택 가능한 텍스트 유지

기둥이 깨지는 이유는 무엇입니까?
PDF의 열 레이아웃은 배치된 레이아웃입니다. 텍스트는 흐름 기반이므로 텍스트나 테이블 그리드에 실제 열을 설정하여 동일한 읽기 순서를 얻을 수 있습니다.
각주는 어떻습니까?
각주는 변환되거나 미주로 표시되거나 일반 텍스트가 될 수 있습니다. 문서가 학문적 또는 법적 용도로 사용되는 경우 항상 각주 링크를 테스트하세요.
잡지 스타일의 PDF에 적합합니까?
무거운 디자인에는 텍스트 패스가 아닌 디자인 도구가 필요할 수 있습니다. 변환은 여전히 ​​텍스트 리프트를 제공하지만 인쇄소에 대한 진정한 레이아웃 복제는 아닙니다.
More versions