About this project
it-programming / data-science-1
Open
Fase 1: Web Scraping de Makro, Olímpica, Ara y D1
Objetivo: Desarrollar un script de web scraping que extraiga los precios de productos específicos (arroz, aceite, leche, detergente en polvo y líquido) de las páginas web de Makro, Olímpica, Ara y D1.
Tareas:
Identificar las URLs de las páginas web de cada supermercado donde se publican los productos.
Analizar la estructura de cada página web (HTML, divs, clases, etc.) Para identificar los elementos que contienen los datos de los productos.
Desarrollar scripts de scraping específicos para cada página usando herramientas como BeautifulSoup o Scrapy para Python.
Guardar la información extraída en un formato estructurado, como archivos CSV o bases de datos, con los siguientes campos:
Nombre del producto
Marca
Precio
Fecha de extracción
Supermercado
Resultados esperados:
Obtener una base de datos actualizada con los precios de los productos seleccionados en los supermercados objetivo.
Fase 2: Modelo de Comparación de Precios
Objetivo: Desarrollar un modelo que permita la comparación de los precios obtenidos en la Fase 1.
Tareas:
Limpiar y estandarizar los datos extraídos (Ej: uniformizar nombres de productos y marcas, manejar los precios en una misma moneda o formato).
Desarrollar un modelo de comparación de precios, que puede ser un simple algoritmo que:
Compare los precios de cada producto entre los distintos supermercados.
Identifique las variaciones y posibles ofertas.
Incorporar reglas adicionales para mostrar:
El precio mínimo por producto en cada supermercado.
El promedio de precios por producto.
La diferencia porcentual entre los precios más altos y bajos.
Resultados esperados:
Un conjunto de tablas que comparan los precios de cada producto en los diferentes supermercados, mostrando la variación y las posibles oportunidades de ahorro.
Fase 3: Visualización en un Tablero
Objetivo: Desarrollar un tablero interactivo para visualizar las comparaciones de precios de forma clara y accesible.
Tareas:
Elegir una plataforma para la visualización de datos (Ej: Power BI, Tableau, o Dash en Python).
Diseñar un tablero con las siguientes características:
Gráficos comparativos para cada producto entre los supermercados.
Filtros por producto, marca y supermercado.
Indicadores de los precios mínimos, máximos y promedio.
Actualización automática cuando se realice un nuevo scraping.
Implementar una lógica de actualización en tiempo real o programada, en la que el scraping se realice de manera regular (por ejemplo, una vez al día) y se refleje en el tablero.
Resultados esperados:
Un tablero interactivo donde los usuarios puedan comparar los precios de los productos de interés de manera visual, clara y actualizada.
Cronograma estimado:
Fase 1 (Web Scraping): 2-3 semanas
Fase 2 (Modelo de comparación): 1-2 semanas
Fase 3 (Visualización): 2-3 semanas
Tecnologías sugeridas:
Fase 1: Python (BeautifulSoup, Scrapy), Pandas para manejar los datos.
Fase 2: Python (Pandas para análisis de datos), Numpy.
Fase 3: Power BI o Tableau para visualización, o Dash/Plotly si prefieres mantener todo en Python.
Project overview
Modelo de Precios
Category IT & Programming
Subcategory Data Science
Project size Small
Is this a project or a position? Project
Required availability As needed
Delivery term: Not specified
Skills needed