Analisando propostas

Mineração de dados no Diário de Justiça Eletrônico e site do Tjsp

Publicado em 25 de Agosto de 2021 dias na TI e Programação

Sobre este projeto

Aberto

Precisamos de uma ferramenta que nos dias úteis baixe o Diário de Justiça Eletrônico do Tribunal de Justiça de São Paulo (link semelhante a https://dje.tjsp.jus.br/cdje/downloadCaderno.do?dtDiario=24/08/2021&cdCaderno=12&tpDownload=D), faça uma busca dentro desse PDF (exemplo anexo) pelos números de processo com um determinado status (fornecerei detalhes de como identificar o começo e o fim do trecho do documento em que se encontram os processos com esse status), extraia e salve esses números.
A partir dessa lista de números de processo, será necessário fazer uma consulta por URL em https://esaj.tjsp.jus.br/cpopg/open.do (necessária autenticação ou recaptcha), de cujo resultado devem ser extraídos outros dados básicos do processo (nome das partes e valor da causa), que devem ser salvos em uma planilha google juntamente com o número de cada processo.

Categoria TI e Programação
Subcategoria Data Science
Tamanho do projeto Médio
Isso é um projeto ou uma posição de trabalho? Um projeto
Disponibilidade requerida Conforme necessário

Prazo de Entrega: Não estabelecido

Outro projetos publicados por L. D. S. K.