Necesito extraer información de productos y precios (ver detalle abajo) de ciertas tiendas de comercio electrónico de cadenas de consumo masivo por medio de la técnica Scraping Web en la que se consultan las páginas de venta de cada producto, se extrae el código de la página, se selecciona la información útil y se almacena en arreglos para luego generar un archivo CSV que pueda ser utilizado para análisis o fuente de datos para otros sistemas.
Ya ha sido desarrollado una version beta en el lenguaje de programación Python en su versión 3.8 usando principalmente el framework Scrapy que fue creado específicamente para las tareas de Scraping en diferentes fuentes y formatos, si usted puede reciclar lo que ya esta desarrollado para trabajar perfecto, si conoce otra forma mas sencilla para poder generar la informacion, fabuloso!
Necesitamos la siguiente informacion:
descripcion de producto
precio venta publico
precio oferta
iva/vat
imagen
categoria
subcategorias 1, 2, 3
la pagina web inicialmente a consultar es la siguiente:
https://www.farmatodo.com.ve/
Quisiera que el servicio se vuelva autonomo para poder manipularlo y descargar en frecuencia semanal cualquier informacion que se requiera.
Consultas varias:
- se necesita algun input? codigos de producto, descripcion, link de las paginas web?
- se puede descargar el portafolio completo por categoria?
- cuantos skus puede descargar x hora?
- cual seria el entregable/ejecutable?
- si hay cambios en la pagina web, cual es el costo de actualizar el script/mecanismo de descarga?
- cual es el tiempo estimado de entrega?
Plazo de Entrega: No definido