Analisando propostas

Scraping de grandes arquivos .pdf buscando por termos e retornando as informações correspondentes.

Publicado em 27 de Setembro de 2021 dias na TI e Programação

Sobre este projeto

Aberto

O sistema deve ser capaz de, a partir do envio de um arquivo excel contendo as informações a serem buscadas e dos arquivos de dados em PDF. Faça uma varredura em vários arquivos grandes em PDF (que está em formato de texto e não imagem). E retorne as informações vinculadas aos dados encontrados.



Ex: Procuro por um número de protocolo num arquivo de 5mil páginas e ele retorna todos os dados da seção desse protocolo encontrado.

Contexto Geral do Projeto

O sistema deve buscar os arquivos pdf, a partir do site: https://dejt.jt.jus.br/cadernos/dejt.html e extrair informações referente aos dados buscados como o numero do processo retornando um arquivo a parte.

Categoria TI e Programação
Subcategoria Programação
Qual é o alcance do projeto? Criar um novo site personalizado
Isso é um projeto ou uma posição de trabalho? Um projeto
Tenho, atualmente Eu tenho uma ideia geral
Disponibilidade requerida Conforme necessário
Funções necessárias Desenvolvedor

Prazo de Entrega: Não estabelecido

Habilidades necessárias