TIFF 转文字

拖拽图片到此处或点击上传

拖拽图片到此处

文件过大(最大 20MB)

档案与办公扫描 TIFF:折痕、透字与表格混排

路由 `scan-tiff-ocr`(tiff_to_text.scan)面向扫描仪输出的 TIFF:可能有轻微倾斜、订书钉阴影与背面透字。先判断是否需要预处理(去倾斜、二值化)再识别;对双面扫描要分清正反面页码。表格与手写批注混排时,可分区识别:印刷体区用一种流程,手写区降低期望值或改人工录入。归档场景建议保留原始 TIFF 与识别文本双份,以满足审计「可机读 + 可核验」。

扫描件 TIFF OCR 操作建议

  1. 进入 `scan-tiff-ocr` 后检查页面方向与倾斜;必要时旋转到阅读方向再识别。
  2. 对表格先框选表头与合计行分别 OCR,避免整表粘连导致行列错乱。
  3. 输出文本与缩略图一并写入档案系统字段,保留扫描 DPI 与操作者记录。

扫描场景 TIFF 转文字问答

在 `scan-tiff-ocr` 场景,扫描 TIFF 识别表格总串行,怎么改善?
分区裁切表头、表体与脚注;降低阴影对比干扰;关键金额列必须人工复核。
表格识别行列经常错位,优先改什么?
分区裁切表头、表体与合计行;先减轻阴影与倾斜,再跑识别。
双面扫描如何防止页码反了?
在清单中标注正/背面与物理页码;识别输出文件名必须含「卷-页」字段。
档案审计要留存哪些证据?
原始 TIFF、识别文本、操作者与时间戳;涉密档案按机构规定加密存储。
手写批注与印刷体混在一页,能一次识别吗?
建议分区:印刷区自动识别,手写区降低期望或人工抄录关键句。
More versions