Analisando propostas

Desenvolvimento de parser Pdf para extração de dados conforme modelo

Publicado em 14 de Junho de 2023 dias na TI e Programação

Sobre este projeto

Aberto

Preciso de um desenvolvedor para desenvolvimento do projeto abaixo:

Um parser pdf que extraia dados dos documentos.

Esse parser deve identificar determinados padrões configuráveis nos documentos.

Tomando como exemplo um recibo de pagamento de salário e o parser deve ser capaz de:
1 - Identificar a empresa pagadora;
2 - Identificar o CNPJ da empresa pagadora;
3 - Identificar o recebedor;
4 -  Identificar o CPF do recebedor;
5 - Identificar a competência;
6 - Identificar o valor liquido do recebimento;

Os campos a serem identificados devem ser personalizáveis ou cadastráveis através de algum tipo de interface para que seja possível cadastro de outros tipos de documentos.

Creio que a solução seja extrair todo o texto do documento e em seguida analisa-lo em busca de padrões regex.

O retorno deve ser em json formatado contendo apenas os dados indexados e o caminho do arquivo.

Categoria TI e Programação
Subcategoria Programação
Qual é o alcance do projeto? Bug ou alteração pequena
Isso é um projeto ou uma posição de trabalho? Eu não sei ainda
Tenho, atualmente Eu tenho uma ideia geral
Disponibilidade requerida Conforme necessário
Experiência nesse tipo de projeto Sim (Eu já gerenciei esse tipo de projeto)
Integrações de API Cloud Storage (Dropbox, Google Drive, etc), Outros (Outras APIs)
Funções necessárias Desenvolvedor

Prazo de Entrega: Não estabelecido

Habilidades necessárias

Outro projetos publicados por R. A.