TIFF를 텍스트로

여기에 이미지를 놓거나 클릭하여 업로드하세요.

여기에 이미지를 드롭하세요.

파일이 너무 큼(최대 20MB)

연구 및 기록 보관소에서 OCR에 TIFF가 여전히 일반적인 이유는 무엇입니까?

TIFF는 무손실 세부 정보, 다중 페이지 스택 및 회색조 충실도를 유지하는 경우가 많기 때문에 원격 감지, 현미경 검사, 저널 수치 및 보관 스캔의 모든 곳에 나타납니다. 사람들은 그림 메모, 눈금 막대 레이블, 표 제목 또는 방법 단락이 검색 가능한 텍스트로 필요할 때 "TIFF OCR", "TIFF에서 텍스트 추출" 또는 "그림 캡션 OCR"을 검색합니다. 브라우저에서 파일은 일반적으로 인식되기 전에 래스터화되므로 페이지 수, 압축 및 픽셀 크기는 속도와 메모리에 직접적인 영향을 미칩니다. 전체 프레임 대신 관심 영역이 필요한지 여부를 조기에 결정하고, 페이지당 주요 언어를 선택하고, 스캔한 문서를 작은 문자나 반전된 배경으로 인해 일반 OCR이 혼동되는 과학 이미지와 다르게 처리하십시오. 각 사본을 소스 경로 또는 해시, 페이지 색인, 언어 선택, 사람이 검토한 최종 텍스트와 결합하여 협업, 규정 준수 및 출판 워크플로를 추적 가능하게 합니다.

권장되는 TIFF-텍스트 작업 흐름

  1. TIFF-텍스트 도구를 열고 단일 또는 다중 페이지 TIFF를 업로드하십시오. 파일이 큰 경우 외부에서 페이지를 분할하거나 텍스트가 많은 페이지만 가져와서 메모리를 예측 가능하게 유지하세요.
  2. 활성 페이지에 대한 인식 언어를 선택하고 필요한 경우 전체 현미경 필드를 OCR하는 대신 자르기 그림 캡션, 방법 블록 또는 테이블 헤더를 선택합니다.
  3. 파일 이름 및 페이지 번호와 함께 텍스트를 원고, 연구 노트 또는 기록 시스템에 복사합니다. 데이터가 게시되지 않거나 기관 정책에 따라 관리되는 경우 공유를 제한합니다.

TIFF를 텍스트로 FAQ

여러 페이지로 구성된 TIFF를 일괄 처리하기 전에 스크립트 정렬을 유지하는 규칙은 무엇입니까?
페이지 색인, 기본 언어, 전체 페이지 대 ROI 정책, 기계 출력의 샘플링 속도를 사용하여 이름 지정을 표준화합니다. 사람이 결론 문단을 검토하고 페이지 참조를 절대 생략하지 마세요.
매우 큰 TIFF에서 브라우저가 멈춥니다. 실제적인 대체 방법은 무엇입니까?
읽을 수 있는 가장 작은 해상도로 다운샘플링하고, 페이지당 TIFF 또는 PNG 배치로 분할하거나, 텍스트 영역만 자릅니다. 대상 작물은 일반적으로 전체 슬라이드 OCR을 능가합니다.
위 첨자, 그리스 문자 및 기호는 끊임없이 잘못 읽혀집니다. 이를 어떻게 처리해야 합니까?
가능한 경우 방정식에 LaTeX 또는 MathML 소스를 사용하십시오. OCR은 수동 전사가 필요한 조밀한 기호 행이 아닌 산문체에 적합합니다.
보관 스캔은 전술적으로 카메라 TIFF와 어떻게 다릅니까?
스캔 시 왜곡 및 조명을 수정합니다. 휴대폰 사진의 관점을 평평하게 만듭니다. 과학적인 TIFF의 경우 전체 이미지에 대해 한 번의 패스를 기대하는 대신 캡션 밴드를 분리합니다.
OCR 출력을 정식 출판물로 바로 보낼 수 있습니까?
저자는 교정을 해야 합니다. 제3자 캡션을 인용할 때는 라이선스 조건을 따르고 출처를 정확한 페이지에 유지하세요.