Gostaria de contratar alguém para automatizar uma coleta de dados do sistema de Serviço de Inspeção Federal (SIF) do Ministério da Agricultura, Pecuária e Planejamento. Seria basicamente um web-scraper (robô para coleta de dados). Os estabelecimentos que produzem algum tipo de produto derivado de animais (carne, leite, couro, etc.) Necessitam ter um SIF (código de 4 dígitos) para poder funcionar e vender seus produtos no Brasil.
O sistema para consultar os dados que necessito é bem simples. Basta digitar o número do sif (4 dígitos) no campo sif e pesquisar. O link da página para consultar os dados está aqui:
https://sigsif.agricultura.gov.br/sigsif_cons/%21ap_estabelec_nacional_cons
Eu vou fornecer um XLS com uma lista de SIFs a serem consultados.
A ideia seria usar essa lista como input para o robô, e aí ele consulta, coleta, e armazena os dados numa planilha XLS (ou csv) na forma de colunas para cada uma das informações disponíveis no resultado da consulta. Por exemplo, todos os SIFs consultados terão um CNPJ, um logradouro, uma data de abertura listados na página de informações (há mais informações que isso na página de consulta; será necessário que o robô colete todas elas). Eu gostaria de armazenar essas informações como colunas nesse XLS (ou csv) para facilitar o uso desses dados depois.
No arquivo anexado, eu faço um vídeo tentando explicar um pouco melhor o que deve ser feito.
Contexto Geral do Projeto
Eu vou usar os dados coletados para artigo de tese de doutorado.
Prazo de Entrega: Não estabelecido