Evaluating bids

Preciso de um programador para desenvolver web scraping e buscar nomes em um website

Published on the April 26, 2019 in IT & Programming

About this project

Open

- Preciso desenvolver um web scraping para buscar nomes em publicacoes do Diario Oficial do rio de Janeiro.
- Preciso que o scraper busque, no DO, por palavras chave que denotem a lista de concluintes de colegios, como "formandos", "concluintes", etc... E busque por: 1) Data da publicacao no do, 2) nome do colegio, 3) endereco do colegio,  4) cnpj do colegio, 5) mantenedor, 6) grau do formando (se ensino medio, medio presencial, medio a distancia, etc... 7) nome do formando 8) diretor, 9) secretario escolar 10) inspetor escolar
- A base pode ser exportada em csv, contendo um aluno por linha e as variaveis descritas acima em colunas.
- Exemplo de pagina: https://www.jusbrasil.com.br/diarios/26280546/pg-9-parte-v-publicacoes-a-pedido-diario-oficial-do-estado-do-rio-de-janeiro-doerj-de-11-02-2011
- Aparentemente parece ser possível fazer um loop na numeração logo após "(...).Com.br/diarios/XXXXXX".
- Algumas páginas podem estar em pdf

Category IT & Programming
Subcategory Web development
What is the scope of the project? Medium-sized change
Is this a project or a position? Project
I currently have I have the design
Required availability As needed
Experience in this type of projects No (I haven’t managed this kind of project before)
API Integrations Other (Other APIs)
Roles needed Developer

Delivery term: Not specified

Skills needed

Other projects posted by V. P. P.