Terminado

Scrapear datos y archivos de una pagina web que estan en formato pdf y disponibilizarlos para una base de datos

Publicado el 11 Diciembre, 2024 en Programación y Tecnología

Sobre este proyecto

Abierto

Scrapear datos y archivos de una pagina web que estan en formato pdf y disponibilizarlos para una base de datos. Se le proveera la web que contiene informacion publica. Sin embargo, esa web tiene un buscador. El buscador no es preciso, trae pocos resultados por palabras clave o trae muchos resultados por palabras clave. Todos los archivos que se encuentran en a traves de ese buscador publico, estan en formato pdf. El trabajo consistira en traer o disponibilizar la mayor cantidad de archivos posibles existentes en esa web, hasta la fecha, y, eventualmente, poder disponibilizar una herramienta que permita mantener actualizado ese repositorio, es decir, que cada vez que se carga algun nuevo archivo en pdf "disponible" en esa web, bajarlo automaticamente

Categoría Programación y Tecnología
Subcategoría Data Science
Tamaño del proyecto Pequeño
¿Es un proyecto o una posición? Un proyecto
Disponibilidad requerida Según se necesite

Plazo de Entrega: 20 Diciembre, 2024

Otros proyectos publicados por C. P.