Analisando propostas

Programa em Java Ocr usando Tesseract

Publicado em 06 de Março de 2018 dias na TI e Programação

Sobre este projeto

Aberto

Eu preciso de um programa que converta imagens digitalizadas (tiff e pdf) para um PDF/A pesquisável.
Requerimento:
>> Precisa ser em Java
>> Deve usar Tesseract (port)
>>Precisa gerar um novo documento pesquisável (PDF/A) a partir de imagens digitalizadas
>>O novo PDF gerado deve ser idêntico ao digitalizado com todas as imagens, tabelas, etc.
>>O programa deve ter um único método.
Um parâmetro string com o caminho da imagem e como retorno um novo caminho do PDF/A pesquisável.

No anexo existem dois arquivos de exemplo. Um é um pdf que não é pesquisável chamado de scanned .pdf e o searchable.pdf é  o arquivo com OCR e pesquisável.

VEJA OS ARQUIVOS QU ESTÃO NO EXEMPLO

Categoria TI e Programação
Subcategoria Programação
Qual é o alcance do projeto? Bug ou alteração pequena
Isso é um projeto ou uma posição de trabalho? Um projeto
Tenho, atualmente Eu tenho especificações
Disponibilidade requerida Conforme necessário
Funções necessárias Desenvolvedor

Prazo de Entrega: Não estabelecido

Habilidades necessárias