Terminado

Webs scraping: base de datos pública de víctimas del franquismo

Publicado el 16 Abril, 2020 en Programación y Tecnología

Sobre este proyecto

Abierto

Requerimiento: crear archivo .csv conteniendo la base de datos pública de "Víctimas de la Guerra Civil y Represaliados del Franquismo" que se lista a partir de la siguiente página web: 
http://pares.mcu.es/victimasGCFPortal/buscadorRaw.form?d-3602157-p=1    

Las filas del archivo .csv deberán contener los respectivos resultados/víctimas con la información asociada a cada uno de ellos, separada en tantas columnas como campos de información existen por cada resultado/víctima.

Se trata de 991.533 resultados / víctimas, que ese sitio web presenta en 39662 páginas.
La última parte de la url indica la página (p=....). P. Ej., La primera pág. Es la ya indicada:

http://pares.mcu.es/victimasGCFPortal/buscadorRaw.form?d-3602157-p=1  

La última pág es:

http://pares.mcu.es/victimasGCFPortal/buscadorRaw.form?d-3602157-p=39662  
En cada registro individual (víctima), el sistema debe ingresar al icono "Ver víctima" y guardar la información que surge de esa página adicional (hay una pág. Adicional por cada víctima/registro principal).

Categoría Programación y Tecnología
Subcategoría Otros
Tamaño del proyecto Pequeño
¿Es un proyecto o una posición? Un proyecto
Actualmente tengo Tengo las especificaciones
Disponibilidad requerida Según se necesite

Plazo de Entrega: 21 Abril, 2020

Habilidades necesarias

PHP

Otros proyectos publicados por I.