Descrição:
Preciso desenvolver um web scraping para buscar nomes de alunos e dados de escolas em publicacoes do Estado do RJ.
A busca poderá ser feita através do site
escavador.com
Período: 01/01/2006 até a data atual
Area: Todos os diários oficiais disponíveis
Palavras trigger: "formandos" & "ensino médio", "concluintes" & "ensino médio", " relação dos concluintes do ensino médio", "educação de jovens e adultos em nível médio"
Podemos fornecer 10 padrões de triggers, os demais deverão ser desenvolvidos pelo programador. Segundo os dados do Censo Escolar, esperamos encontrar pelo menos 1 milhão de concluintes ao longo de pelo menos 10 anos de publicações.
Código em Python, a ser disponibilizado ao contratante
Base de dados exportada em .csv
Fomato da base:
Linha: Cada aluno deverá compor uma linha
Colunas:
1-Nome do DO. EX: Diário Oficial do estado do Rio de Janeiro,
2- Data da publicação no DO
3- Página do DO
4- Publicação a pedido? 1= Sim, 2= Não
5- Nome da escola
6- CNPJ da escola
7- Mantenedor (quando disponível. Trigger, mantido, mantenedor, etc..
.)
8- Endereço (triggers: situado. Sito , localizado)
9- Ano de formatura (triiger possivel, ano letivo)
10- Semestre de formatura (quando disponível)
11- Modalidade ( 1= regular (ou quando não aparecer modalidade,
2= técnico ou concomitante com técnico
3= educação especial
4= educação no campo
5= educação indígena
6= educação quilombola )
12 - EAD? 1 = Sim, se ensino à distância (trigger possível: "EAD", "EaD", "Ensino à Distância", "Educação à DIstância", "Modalidade à Distância" , 2 = Não, se ensino presencial ou informação ausente
13 - EJA? 1 = Sim, se Educação de Jovens e Adultos (trigger possível: "EJA" ou "Educação de Jovens e Adultos"), 2 = Não, se não especificado
14- Área de especialização ( Para curso técnico: ex: Enfermagem, informatica, eletrotécnica, administração, processamento de dados, secretariado, etc.... ex de trigger: curso técnico em enfermagem
15- Nome do aluno
16- CPF do aluno (quando disponível, raro)
17- RG do aluno (quando dispoível, raro)
18- Diretor da escola
Categoria: TI e Programação
Subcategoria: Programação
Qual é o alcance do projeto?: Alteração média
Isso é um projeto ou uma posição de trabalho?: Um projeto
Tenho, atualmente: Eu tenho especificações
Disponibilidade requerida: Conforme necessário
Experiência nesse tipo de projeto: Não (Eu nunca gerenciei esse tipo de projeto)
Funções necessárias: Desenvolvedor
Prazo de Entrega: 23 de Julho de 2019