Realizado

Web Scrapping

Publicado em 18 de Março de 2024 dias na TI e Programação

Sobre este projeto

Aberto

Buenos Días!
Necesito rescatar información sobre 4 sitios web de noticias chilenos, para el periodo 01-01-2018 y el 31-12-2023, por intermedio de Web scrapping.

1) La información que necesito rescatar es sobre la sección noticias (no me interesan las secciones deportes, economía, etc.), Consultando en específico sobre información que contenga los siguientes marcadores "Migrante", "Inmigrante", "Extranjero","Crimen Organizado", "Inseguridad", "Violencia", "Drogas", "Robo", "Delincuencia", "Delito".

2) La información rescatada, se debe expresada en formato de texto editable en formato .txt o .docs, debidamente individualizada por medio al que corresponde y su fecha (Ej: Emol_01_01_20023), el que puede ser presentado en documentos individualizados (un documento por noticia filtrada). A su vez  es necesaria la presentación de una tabla (puede ser en excel) que presente el medio de comunicación, el link y la fecha de publicación de la noticia (Base/tabla básica).

3) Se solicita analizar los datos extraidos, con la finalidad de identificar patrones, tendencias y discursos dominantes en la cobertura mediática. Esto podría incluir el análisis de sentimientos, la identificación de temas recurrentes, la detección de narrativas dominantes y la evaluación del tono y la polarización de los contenidos. Este análisis debe ser presentado en un informe en texto editable, formato .docs (word).

5) Los sitios web a trabajar son los siguientes:
--> www.biobiochile.cl
--> www.latercera.com
--> www.emol.com
--> www. Ex-ante.cl

6) Necesito que el o los códigos sean trabajados en Pyton y presentados/entregados en el informe final. (Esto es importante y no transable)

Contexto Geral do Projeto

La información que necesito rescatar, es para el desarrollo de un proyecto universitario. Este proceso lo he realizado anteriormente de manera manual, pero para periodos más acotados de tiempo, por lo que por volumen y tiempo acotado que tengo, veo que es necesario recurrir a Web Scrapping.

Categoria TI e Programação
Subcategoria Programação
Qual é o alcance do projeto? Bug ou alteração pequena
Isso é um projeto ou uma posição de trabalho? Um projeto
Tenho, atualmente Não se aplica
Disponibilidade requerida Conforme necessário
Funções necessárias Desenvolvedor

Prazo de Entrega: 01 de Maio de 2024

Habilidades necessárias