Evaluating bids

Mineração de dados no Diário de Justiça Eletrônico e site do Tjsp

Published on the August 25, 2021 in IT & Programming

About this project

Open

Precisamos de uma ferramenta que nos dias úteis baixe o Diário de Justiça Eletrônico do Tribunal de Justiça de São Paulo (link semelhante a https://dje.tjsp.jus.br/cdje/downloadCaderno.do?dtDiario=24/08/2021&cdCaderno=12&tpDownload=D), faça uma busca dentro desse PDF (exemplo anexo) pelos números de processo com um determinado status (fornecerei detalhes de como identificar o começo e o fim do trecho do documento em que se encontram os processos com esse status), extraia e salve esses números.
A partir dessa lista de números de processo, será necessário fazer uma consulta por URL em https://esaj.tjsp.jus.br/cpopg/open.do (necessária autenticação ou recaptcha), de cujo resultado devem ser extraídos outros dados básicos do processo (nome das partes e valor da causa), que devem ser salvos em uma planilha google juntamente com o número de cada processo.

Category IT & Programming
Subcategory Data Science
Project size Medium
Is this a project or a position? Project
Required availability As needed

Delivery term: Not specified

Other projects posted by L. D. S. K.