Obtenção dos dados processuais do site
https://pje.trf5.jus.br/pje/ConsultaPublica/listView.seam (e das suas variantes que possuem o mesmo layout, onde "trf5" pode ser substituido por: jfrn, jfal, jfce, jfpb, jfpe, jfse).
O programa deve aceitar os inputs para os seguintes campos para o formulário do site:
"Nome da Parte"
"Classe Judicial"
Considerando a necessidade de inputs do usuário e o fato de que existe apenas 1 captcha por consulta, é dispensável a quebra do captcha, bastando apresentá-lo para entrada pelo usuário.
Após submeter uma consulta (ex.: Nome da parte = “Universidade Federal da Paraíba”; Classe Judicial = “PROCESSO CÍVEL E do trabalho|recursos|apelação cível|”, deverá percorrer todas as páginas de resultados (44, no exemplo acima).
Em cada página de resultado, deverá acessar os links de cada processo.
Em cada processo, deverá obter todas as informações processuais, incluindo:
Dados do processo
Assuntos
Polo ativo
Polo passivo
Movimentações processuais (deverá percorrer todas as páginas das movimentações). Nas movimentações, deverá extrair todos os documentos com links disponibilizados no campo ‘Documento” e armazená-los em formato de texto no lugar do link na tabela de movimentos.
A saída do programa deverá ser um arquivo CSV contendo as informações processuais e outro com as suas movimentações.
Desejável, mas não imprescindível, que seja escrito em Python.
Prazo de Entrega: Não estabelecido