Analisando propostas

Projeto em Python para extração de dados de fontes oficiais Cliente enterprise

Publicado em 11 de Novembro de 2021 dias na TI e Programação

Sobre este projeto

Aberto

No Workana Empresas, buscamos para um de nossos clientes um desenvolvedor Python para início imediato.

O projeto consiste no desenvolvimento de códigos e scripts para extração de textos de fontes em PDF's, como os diários oficiais. O processo abrange desde a captura em sites abertos, extração do texto, estruturação em uma base (noSQL/MongoDB). Talvez o maior desafio seja a extração com qualidade dos diários oficiais, uma vez que alguns podem ter mais de uma coluna de texto por página.
É Possível que seja necessário o uso de OCR ou algum algoritmo de extração, machine learning para refinar as quebras.
O freelancer precisa conhecer Python (primordial) e como diferenciais Scrapy, OpenCV, Tesseract, bibliotecas para extração de texto em imagens e data-quality e MongoDB.

Se você se encaixa no perfil, envie sua proposta com sua experiência e não se esqueça de anexar o seu cv! esperamos você!

IMPORTANTE: esse projeto é para um cliente prime, portanto a comissão é fixa em 13% (não se aplica a comissão escalonada).

Categoria TI e Programação
Subcategoria Programação
Qual é o alcance do projeto? Alteração média
Isso é um projeto ou uma posição de trabalho? Um projeto
Tenho, atualmente Eu tenho especificações
Disponibilidade requerida Conforme necessário
Integrações de API Outros (Outras APIs)
Funções necessárias Desenvolvedor

Prazo de Entrega: Não estabelecido

Habilidades necessárias

Outro projetos publicados por V. T.