Quando o PDF é uma imagem de palavras, não de palavras
Um PDF é fácil de visualizar, mas as palavras que você precisa podem ficar presas: citações longas para RFPs, limpeza de dados, preparação de tradução ou uma citação que você deve colar sem redigitar.A extração é a ponte para as ferramentas de texto normais.OCR é para digitalizações, fotos e PDF que parecem texto, mas nunca foram realmente selecionáveis até uma passagem cuidadosa e uma leitura cuidadosa posteriormente.Para digitalizações, o OCR faz parte da história, e uma leitura cuidadosa ainda é o hábito do escritório que evita que um 3 silencioso se transforme em um 8 em uma identificação de caso, porque o corretor ortográfico não é um oficial de conformidade.Quando o texto extraído deve se tornar um novo documento oficial, muitas equipes fazem uma conversão de PDF em Word para edição e, quando o produto final ainda é um PDF, lembre-se de que você também pode compactar o PDF para e-mail para que a nova exportação seja transportada de forma limpa.Imagine um colega remoto que não pode ir até sua mesa para “simplesmente abrir a mesa certa” e um cliente que é educado, mas ocupado;o nome do arquivo e a estrutura do arquivo fazem parte do respeito que você demonstra por eles.Imagine um trabalhador de campo enviando recibos, um estudante em home office enviando um pacote de tese e um gerente de projeto que ainda precisa obter aprovação para um pedido de alteração: títulos diferentes, a mesma pressão de tempo.Um bom hábito é manter um nome mestre óbvio e uma data óbvia no nome do arquivo, para que no futuro você possa encontrar o pacote sem abrir dez cópias, todas parecidas.Se a próxima etapa do seu dia for um limite apertado de caixa de correio, é útil saber que você pode mesclar PDF online gratuitamente para uma única transferência, compactar PDF para e-mail quando um tópico é rejeitado, converter PDF em Word quando uma edição rápida é mais rápida do que uma reconstrução e assinar PDF online quando aprovadores remotos estão aguardando uma contra-assinatura.
Mude do PDF digitalizado para um texto que você pode corrigir
- Se a digitalização estiver muito distorcida, tente fazer uma nova digitalização com bordas retas, porque uma boa entrada sempre supera o heróico software de correção no fluxo de trabalho do escritório.
- Execute o OCR e a conversão e, em seguida, use o painel de navegação do texto para ver se os títulos se tornaram níveis de contorno reais ou apenas linhas em negrito que você deve reestruturar para um sumário.
- Leia cada página com números e nomes próprios lentamente e guarde o PDF digitalizado para necessidades de auditoria onde a imagem é a fonte da verdade para assinaturas e carimbos.