Evaluando propuestas

Ocr para Pdf'S y Extracción de contenido

Publicado el 05 Abril, 2021 en Programación y Tecnología

Sobre este proyecto

Abierto

El proyecto consiste en procesar pdf's (Algunos vienen bien estructurados en texto , otros son escaneados y deben ser pasados por un OCR) , buscar unas palabras claves apartir de logica difusa (https://es.wikipedia.org/wiki/L%C3%B3gica_difusa) (Ya que los pdf's cambian su estructura dependiendo de la entidad que publica la dicho pdf) y posterior a eso extraer el bloque de contenido deseado.

Pensamos que es util implementar matching learning para el aprendizaje de donde sacar cada item por cada pdf o almenos la pragmatica que debe tener el sistema.

Contexto general del proyecto

- Se debe tener un API para enviar el documento + campos y que este responda en json con los campos extraidos - Debe ser compatible con linux, ya que el código fuente correrá sobre un centos 7

Categoría Programación y Tecnología
Subcategoría Otros
Tamaño del proyecto Medio
¿Es un proyecto o una posición? Un proyecto
Actualmente tengo Tengo las especificaciones
Disponibilidad requerida Según se necesite

Plazo de Entrega: No definido

Habilidades necesarias