Evaluando propuestas

Extracción de datos de Pdf con expresiones regulares (evaluar uso de tesseract)

Publicado el 29 Mayo, 2020 en Programación y Tecnología

Sobre este proyecto

Abierto

Hola, necesito desarrollar un web service que reciba un archivo PDF, lo convierta a texto, y le aplique una serie de expresiones regulares para obtener información, y con eso armar un json /excel con los datos.

La inteface web debería tener a la izquierda una lista de documentos que uno va arrastrando para cargar, y luego haciendo clic ejecuta el proceso, en el medio se muestra el documento, y a la derecha el listado de datos reconocidos mediante las expresiones, por ejemplo, de los PDF necesito extraer un CODIGO_BARRAS (40 números), entonces a la derecha aparecería ese dato en verde si es que fue detectado, sino en rojo, permitiendo completarlo a mano dado que uno estaría viendo el PDF en el centro de la pantalla.

Luego esa info debería ser descargable.

Categoría Programación y Tecnología
Subcategoría Programación Web
¿Cuál es el alcance del proyecto? Crear un nuevo sitio personalizado
¿Es un proyecto o una posición? Un proyecto
Actualmente tengo Tengo las especificaciones
Disponibilidad requerida Según se necesite
Experiencia en este tipo de proyectos Sí (He administrado este tipo de proyectos anteriormente)
Roles necesarios Programador

Plazo de Entrega: No definido

Habilidades necesarias