Sobre este proyecto
it-programming / web-development
Abierto
Buenos Días!
Necesito rescatar información sobre 4 sitios web de noticias chilenos, para el periodo 01-01-2018 y el 31-12-2023, por intermedio de Web scrapping.
1) La información que necesito rescatar es sobre la sección noticias (no me interesan las secciones deportes, economía, etc.), Consultando en específico sobre información que contenga los siguientes marcadores "Migrante", "Inmigrante", "Extranjero","Crimen Organizado", "Inseguridad", "Violencia", "Drogas", "Robo", "Delincuencia", "Delito".
2) La información rescatada, se debe expresada en formato de texto editable en formato .txt o .
... leer más docs, debidamente individualizada por medio al que corresponde y su fecha (Ej: Emol_01_01_20023), el que puede ser presentado en documentos individualizados (un documento por noticia filtrada). A su vez es necesaria la presentación de una tabla (puede ser en excel) que presente el medio de comunicación, el link y la fecha de publicación de la noticia (Base/tabla básica).
3) Se solicita analizar los datos extraidos, con la finalidad de identificar patrones, tendencias y discursos dominantes en la cobertura mediática. Esto podría incluir el análisis de sentimientos, la identificación de temas recurrentes, la detección de narrativas dominantes y la evaluación del tono y la polarización de los contenidos. Este análisis debe ser presentado en un informe en texto editable, formato .docs (word).
5) Los sitios web a trabajar son los siguientes:
--> www.biobiochile.cl
--> www.latercera.com
--> www.emol.com
--> www. Ex-ante.cl
6) Necesito que el o los códigos sean trabajados en Pyton y presentados/entregados en el informe final. (Esto es importante y no transable) retraer
Contexto general del proyecto
La información que necesito rescatar, es para el desarrollo de un proyecto universitario. Este proceso lo he realizado anteriormente de manera manual, pero para periodos más acotados de tiempo, por lo que por volumen y tiempo acotado que tengo, veo que es necesario recurrir a Web Scrapping.
Categoría Programación y Tecnología
Subcategoría Programación Web
¿Cuál es el alcance del proyecto? Bug o cambio pequeño
¿Es un proyecto o una posición? Un proyecto
Actualmente tengo No aplica
Disponibilidad requerida Según se necesite
Roles necesarios Programador
Plazo de Entrega: 01 Mayo, 2024
Habilidades necesarias