Bom dia, segue escopo:
crawler em php + mysql
fornecemos dois números de processos como base para o desenvolvimento: 0252568-47.2016.8.13.0701, 0192812-73.2017.8.13.0701
Deverá criar um robô crawler que acesso o site
http://www.tjmg.jus.br/portal-tjmg/processos/andamento-processual/#.W2m2aihKiUk e realize a consulta das informações do processo supracitado e salve as mesmas no banco de dados mysql, sendo 02 tabelas apenas. 01 tabela para as informações do processo em questão e 01 tabela para ,inserção da lista com os andamentos do respectivo processo.
As informações do processo são coletadas uma única vez, mas os andamentos são atualizados diariamente.
Deverá criar nas tabelas os mesmos campos para as informações do processo, e na tabela de andamentos alem da data, conteudo do andamento o id do processo vinculado criado na tabela com as informações básicas do processo.
O site possui captcha durante o dia que ao ser digitado uma vez fica desativado por cerca de 30 minutos, entretanto o captcha é totalmente desativado à noite geralmente das 19h às 03h da manhã.
Link para coleta das informações básicas do processo (não precisa pegar as 03ultimas movimentações nessa tela, pois deverá ppegar no link de andamentos):
http://www4.tjmg.jus.br/juridico/sf/proc_resultado.jsp?tipoPesquisa=1&txtProcesso=02525684720168130701&comrCodigo=701&nomePessoa=&tipoPessoa=X&naturezaProcesso=0&situacaoParte=X&codigoOAB=&tipoOAB=N&ufOAB=MG&numero=1&select=1&tipoConsulta=1&natureza=0&ativoBaixado=X&listaProcessos=02525684720168130701
Andamentos e movimentações são sinonimos.
Link para coleta dos andamentos:
http://www4.tjmg.jus.br/juridico/sf/proc_movimentacoes.jsp?comrCodigo=701&numero=1&listaProcessos=16025256
Nos links o numero 701 é o codigo da comarca e o numero ao final do link do andamento geralmente é parte do numero inicial do processo.
Parazo de 07 dias para desenvolimento, nos enviar o banco e arquivo fonte para analise.
Qualidade e logica de desenvolvimento do código serão avaliados.
Levar em consideração orçamento para desenvolver outros crawlers no mesmo formato para lista abaixo dos sites de outros tribunais.
Levar em consideração que alguns sites não desativam o captcha.
Lista dos demais tribunais:
https://www4.tjmg.jus.br/juridico/sf/proc_massiva2.jsp
tjmg pje:
https://pje.tjmg.jus.br/pje/ConsultaPublica/listView.seam
Prazo de Entrega: 16 de Março de 2020