Analisando propostas

Webscraping do Do do Rj

Publicado em 03 de Julho de 2019 dias na TI e Programação

Sobre este projeto

Aberto

Descrição:
Preciso desenvolver um web scraping para buscar nomes de alunos e dados de escolas em publicacoes do Estado do RJ.

A busca poderá ser feita através do site escavador.com

Período: 01/01/2006 até a data atual
Area: Todos os diários oficiais disponíveis

Palavras trigger: "formandos" & "ensino médio", "concluintes" & "ensino médio", " relação dos concluintes do ensino médio", "educação de jovens e adultos em nível médio"

Podemos fornecer 10 padrões de triggers, os demais deverão ser desenvolvidos pelo programador. Segundo os dados do Censo Escolar, esperamos encontrar pelo menos 1 milhão de concluintes ao longo de pelo menos 10 anos de publicações.

Código em Python, a ser disponibilizado ao contratante
Base de dados exportada  em .csv
Fomato da base:

Linha: Cada aluno deverá compor uma linha
Colunas:
1-Nome do DO. EX: Diário Oficial do estado do Rio de Janeiro, 
2- Data da publicação no DO
3- Página do DO
4- Publicação a pedido? 1= Sim, 2= Não
5- Nome da escola
6- CNPJ da escola
7- Mantenedor (quando disponível. Trigger, mantido, mantenedor, etc..




.)
8- Endereço (triggers: situado. Sito , localizado)
9- Ano de formatura (triiger possivel, ano letivo)
10- Semestre de formatura (quando disponível)
11- Modalidade  ( 1= regular (ou quando não aparecer modalidade,
                            2= técnico ou concomitante com técnico
                            3= educação especial
                            4= educação no campo
                            5= educação indígena
                            6= educação quilombola )
12 - EAD? 1 = Sim, se ensino à distância (trigger possível: "EAD", "EaD", "Ensino à Distância", "Educação à DIstância", "Modalidade à Distância" , 2 = Não, se ensino presencial ou informação ausente
13 - EJA? 1 = Sim, se Educação de Jovens e Adultos (trigger possível: "EJA" ou "Educação de Jovens e Adultos"), 2 = Não, se não especificado
14- Área de especialização ( Para curso técnico: ex: Enfermagem, informatica, eletrotécnica, administração, processamento de dados, secretariado, etc.... ex de trigger: curso técnico em enfermagem
15- Nome do aluno
16- CPF do aluno (quando disponível, raro)
17- RG do aluno (quando dispoível, raro)
18- Diretor da escola

Categoria: TI e Programação
Subcategoria: Programação
Qual é o alcance do projeto?: Alteração média
Isso é um projeto ou uma posição de trabalho?: Um projeto
Tenho, atualmente: Eu tenho especificações
Disponibilidade requerida: Conforme necessário
Experiência nesse tipo de projeto: Não (Eu nunca gerenciei esse tipo de projeto)
Funções necessárias: Desenvolvedor

Categoria TI e Programação
Subcategoria Programação
Qual é o alcance do projeto? Alteração média
Isso é um projeto ou uma posição de trabalho? Um projeto
Tenho, atualmente Eu tenho o design
Disponibilidade requerida Conforme necessário
Funções necessárias Desenvolvedor

Prazo de Entrega: 23 de Julho de 2019

Habilidades necessárias

Outro projetos publicados por V. P. P.