Evaluating bids

Webcrawler Site da Certidão de Débitos Relativos a Créditos Tributários Federais e à Dívida Ativa da União

Published on the August 09, 2022 in IT & Programming

About this project

Open

Necessitamos de um webcrawler em Python do site da Certidão de Débitos Relativos a Créditos Tributários Federais e à Dívida Ativa da União (https://solucoes.receita.fazenda.gov.br/Servicos/certidaointernet/PJ/Emitir) em que com a entrada dos seguintes dados:

{
cnpj: xxxx,
metodo_de_consulta: segunda_via (ou emitir_nova_certidao),
tipo_de_pesquisa_segunda_via: data_validade (ou data_emissao),
data_inicio_segunda_via: data_inicio,
data_final_segunda_via: data_final
}

ele devolva todos os dados da certidão emitida em um json:

{
codigo_de_controle: xxxx,
tipo: negativa (ou positiva, ou positiva com efeito de negativa),
data_hora_emissao: xxx,
data_validade: xxx,
situação: valida (ou expirada),
razão_social: xxxx
}

além disso também preciso que seja salvo o pdf que pode ser consultado no link.

Alguns pontos importantes:

1 - em alguns casos o site nao encontra a certidão e informa que é preciso procurar um CAC da receita para emitir, e é preciso que devolva essa informação. isso acontece quando a certidão é positiva (sem efeito de negativa);

2 - as vezes pede captcha e as vezes não pede, quando pedir é preciso que ele resolva com alguma API (você pode sugerir a que preferir)

3 - é preciso entender quando o site está fora do ar e devolver isso na resposta, para que o sistema tente de novo depois;

4 - vamos rodar isso num lambda da AWS, então precisa já estar de um jeito que seja possível rodar dessa forma, ou seja, de preferência, sem selenium ou com o selenium de alguma forma que funcione num lambda

Category IT & Programming
Subcategory Web development
What is the scope of the project? Medium-sized change
Is this a project or a position? Project
I currently have I have specifications
Required availability As needed
Roles needed Developer

Delivery term: Not specified

Skills needed

Other projects posted by J. M.