Terminado

Extraer texto de archivos Pdf estructurados

Publicado el 20 Enero, 2023 en Programación y Tecnología

Sobre este proyecto

Abierto

Tengo archivos PDF (no escaneados) que contienen datos estilo formulario.Todos los formularios son iguales lo que varían es contenido de las casillas. Utilizando Excel logro sacar el valor de cada casillero realizando lo siguiente:
1. Abro el PDF con mi navegador web
2. Copio todo el texto del archivo PDF y lo pego en una celda
3. Utilizando las funciones hallar, extrae, izquierda y derecha ubico los valores de los casilleros para extraer solamente el valor que necesito.
4. Tengo las fórmulas en Excel con las que puedo ubicar todos los casilleros del formulario PDF y traer su valor.

Me pregunto si es posible hacer algo similar realizando una especie de api en donde se cargue el formulario PDF, se extraigan los valores que necesito y se presenten los mismos como una respuesta tipo xml o json.

No tengo ningún conocimiento de programación, es simplemente una idea.

Contexto general del proyecto

Adjunto ejemplo del excel que utilizo para hacer este trabajo

Categoría Programación y Tecnología
Subcategoría Programación Web
¿Cuál es el alcance del proyecto? Crear un nuevo sitio personalizado
¿Es un proyecto o una posición? Un proyecto
Actualmente tengo Tengo una idea
Disponibilidad requerida Según se necesite
Integraciones de API Otros (Otras APIs)
Roles necesarios Programador

Plazo de Entrega: No definido

Habilidades necesarias

Otros proyectos publicados por D. M.