Completed

Scrapy - Búsqueda de información en la web

Published on the April 07, 2023 in IT & Programming

About this project

Open

Hola, tengo ya funcionando varias spiders en scrapy. Funcionan perfectamente en forma individual. Pero si  quiero ejecutar varias arañas desde un script de python, algunas funcionan y otras me dan un error de tldextract. El error es este: filelock._error.Timeout: The file lock 'C:\Program Files\Python311\Lib\site-packages\tldextract\.suffix_cache/publicsuffix.org-tlds\de84b5ca2167d4c83e38fb162f2e8738.tldextract.json.lock' could not be acquired.
También me gustaría que en el script que se ejecutan las distintas arañas se pueda se puedan poner intervalos de tiempo y frecuencia de ejecución.

Category IT & Programming
Subcategory Other
Project size Small
Is this a project or a position? Project
I currently have I have specifications
Required availability As needed

Delivery term: Not specified

Skills needed