Completed

Web Scrapping

Published on the March 18, 2024 in IT & Programming

About this project

Open

Buenos Días!
Necesito rescatar información sobre 4 sitios web de noticias chilenos, para el periodo 01-01-2018 y el 31-12-2023, por intermedio de Web scrapping.

1) La información que necesito rescatar es sobre la sección noticias (no me interesan las secciones deportes, economía, etc.), Consultando en específico sobre información que contenga los siguientes marcadores "Migrante", "Inmigrante", "Extranjero","Crimen Organizado", "Inseguridad", "Violencia", "Drogas", "Robo", "Delincuencia", "Delito".

2) La información rescatada, se debe expresada en formato de texto editable en formato .txt o .docs, debidamente individualizada por medio al que corresponde y su fecha (Ej: Emol_01_01_20023), el que puede ser presentado en documentos individualizados (un documento por noticia filtrada). A su vez  es necesaria la presentación de una tabla (puede ser en excel) que presente el medio de comunicación, el link y la fecha de publicación de la noticia (Base/tabla básica).

3) Se solicita analizar los datos extraidos, con la finalidad de identificar patrones, tendencias y discursos dominantes en la cobertura mediática. Esto podría incluir el análisis de sentimientos, la identificación de temas recurrentes, la detección de narrativas dominantes y la evaluación del tono y la polarización de los contenidos. Este análisis debe ser presentado en un informe en texto editable, formato .docs (word).

5) Los sitios web a trabajar son los siguientes:
--> www.biobiochile.cl
--> www.latercera.com
--> www.emol.com
--> www. Ex-ante.cl

6) Necesito que el o los códigos sean trabajados en Pyton y presentados/entregados en el informe final. (Esto es importante y no transable)

Project overview

La información que necesito rescatar, es para el desarrollo de un proyecto universitario. Este proceso lo he realizado anteriormente de manera manual, pero para periodos más acotados de tiempo, por lo que por volumen y tiempo acotado que tengo, veo que es necesario recurrir a Web Scrapping.

Category IT & Programming
Subcategory Web development
What is the scope of the project? Small change or bug
Is this a project or a position? Project
I currently have Not applicable
Required availability As needed
Roles needed Developer

Delivery term: May 01, 2024

Skills needed