Terminado

Web Scraping y Periodismo de Datos - Descarga, edición y presentación de bases de datos de interés público

Publicado el 05 Septiembre, 2023 en Programación y Tecnología

Sobre este proyecto

Abierto

Buscamos freelancer que posea simultáneamente:

* Dominio y experiencia en Web Scraping 
* Excelente capacidad de redacción.
* Dominio avanzado de Excel y gestión de bases de datos en formato csv o xls.
................................................................................
La tarea consiste en:

I) etapa técnica/web scraping

1) la descarga de la web, a través de web scraping, de cinco (5) bases de datos - a propuesta del freelancer - , que cumplan con lo siguiente:

1.1.) Sean de acceso legítimo y público.

1.2.) Su contenido (o la mayor parte de él) no se encuentre indexado en la web por Google.

1.3.) Posean una cantidad significativa de registros, en virtud de lo cual no sea razonable una descarga manual de la información.

1.4.) No estén ya incluidas en la plataforma de Datos Abiertos del proyecto.
     
1.5.) Su contenido sea de interés general, aunque dentro de una amplia variedad de temáticas (profesionales, centros médicos, empresas e instituciones de rubros varios, productos, información estadísticas por país, ránkings, etc.).
     
1.6.) Estén en idioma español o inglés.

Por cada una de las bases de datos, se elaborará un archivo en formato csv.

Ii) etapa editorial

2) en relación a cada una de las bases de datos, su edición y presentación en la plataforma de datos abiertos del proyecto, de forma enriquecida, útil y atractiva para los usuarios. Esto implica:
     
2.1.) Asignar a la base un Título y una Descripción de su contenido. La Descripción deberá incluir la Fuente de la base y su Fecha de Actualización.
     
2.2.) Cuando es necesario, normalizar los nombres de los Campos de la base (p. Ej., Cuando en la base original están expresados con abreviaturas o códigos).
     
2.3.) Asignar a la base una Imagen alusiva - a localizar en la web mediante la función de Google Imágenes que permite identificar imágenes con derecho de uso -.
     
2.4.) Determinar razonablemente los Campos por los que los usuarios finales podrán hacer búsquedas en la base.
     
2.5.) Determinar razonablemente el Campo principal de la base, en tanto Campo que dará nombre a la página web única de cada registro de la base.
     
2.6.) Subir la base a la plataforma de Datos Abiertos del proyecto.
     
Otros detalles específicos del requerimiento serán brindados a los postulantes.

3. GENERALIDADES:

3.1. El freelancer debe entregar los scripts o código que elabore en relación a este requerimiento.

3.2. El freelancer entiende y acepta que entregas parciales, incompletas o que no se ajusten plenamente a lo requerido no generarán derecho a pago alguno.

MUCHAS GRACIAS

Contexto general del proyecto

Buscamos experticia en Web Scraping y Redacción para Periodismo de Datos

Categoría Programación y Tecnología
Subcategoría Programación Web
¿Cuál es el alcance del proyecto? Cambio mediano
¿Es un proyecto o una posición? Un proyecto
Actualmente tengo Tengo las especificaciones
Disponibilidad requerida Según se necesite
Roles necesarios Programador, Otro
Otros roles necesarios Dominio simultáneo de Web Scraping y Redacción

Plazo de Entrega: No definido

Habilidades necesarias

Otros proyectos publicados por I.