Evaluando propuestas

Desarrollo de Scraper/Crawler para Wordpress con Tema Madara

Publicado el 12 Noviembre, 2024 en Programación y Tecnología

Sobre este proyecto

Abierto

Busco un desarrollador experimentado en scrapers/crawlers y en desarrollo de plugins para WordPress, específicamente para la creación de un sistema automatizado que permita extraer mangas en español de múltiples páginas web y publicarlos en mi sitio, que utiliza el tema Madara para mangas.

Requerimientos Específicos del Proyecto:

Extracción de Datos desde Múltiples Fuentes:

Crear un scraper que extraiga datos de varias páginas web de manga en español.
Los sitios objetivo deben incluir metadatos completos de cada manga (título, sinopsis, género, demografía, capítulos, imágenes, etc.).
Integración con Tema Madara de WordPress:

Los datos deben publicarse de manera compatible con el tema Madara, utilizando los campos personalizados del tema.
Cada manga debe tener su propia página en el sitio, y los capítulos deben organizarse con el mismo estilo visual que ofrece Madara (incluyendo imágenes de capítulos y opciones de lectura).
Actualización Automática:

Programación automática para agregar nuevos capítulos de mangas existentes y nuevos títulos que se publiquen en las páginas de origen.
El sistema debe verificar periódicamente en las fuentes para actualizar automáticamente el contenido.
Compatibilidad con la Estructura de URLs y Categorías:

Mantener la misma estructura de URLs para los mangas y capítulos de acuerdo con el tema Madara.
Asignar automáticamente los mangas a categorías y etiquetas específicas (por ejemplo, demografía, género) en base a la información extraída.
Panel de Control Personalizado en WordPress:

Crear un panel de administración que permita al usuario configurar las fuentes de manga, revisar y aprobar manualmente mangas antes de publicarlos si se desea, y gestionar la frecuencia de actualización.
Opciones para editar o actualizar títulos, sinopsis, imágenes, o capítulos manualmente dentro del panel.
Optimización para SEO:

Incluir automáticamente metadescripciones, títulos seo y palabras clave en las publicaciones para mejorar el seo del sitio.
API de MangaDex (Opcional):

Integración con la API de MangaDex para obtener mangas de esta fuente en español.
Permitir importar y actualizar mangas directamente desde MangaDex y de otras fuentes.
Requisitos Técnicos:

Experiencia en desarrollo de scrapers y api rest.
Conocimientos de PHP, MySQL y desarrollo de plugins para WordPress.
Familiaridad con el tema Madara para garantizar que el contenido se integre correctamente.
Experiencia en automatización de tareas y programación de cron jobs en WordPress.
Conocimiento de buenas prácticas en SEO para optimizar el contenido publicado automáticamente.
Información Adicional:

Se valorará experiencia previa con proyectos similares en sitios de mangas o contenido de lectura.
Entregables: Código fuente del scraper/crawler, documentación para mantenimiento, y un manual de usuario para el panel de control.

Contexto general del proyecto

El proyecto consiste en la creación y desarrollo de un sitio web especializado en mangas en español, construido sobre WordPress y utilizando el tema Madara, un tema optimizado para la presentación de cómics y mangas. El objetivo es ofrecer a los usuarios acceso a una gran biblioteca de mangas de diferentes géneros, con una experiencia de lectura fluida y organizada. Para ello, el sitio necesita un sistema automatizado que permita extraer mangas de múltiples fuentes de manera confiable y en tiempo real, garantizando actualizaciones constantes de nuevos capítulos y títulos. Objetivo Principal: Convertirse en una plataforma de referencia para la lectura de mangas en español, con una biblioteca extensa y actualizada regularmente. La automatización de la publicación y actualización de contenido será clave para mantener el sitio activo y relevante. Componentes Clave del Proyecto: Automatización del Contenido: Implementar un sistema de scraping y crawling que permita extraer mangas en español de múltiples páginas de manera automática. Uso de la API de MangaDex y otros sitios de mangas en español, en combinación con scrapers personalizados, para obtener tanto títulos completos como nuevos capítulos que se publican en las fuentes. Los datos extraídos incluyen título, sinopsis, género, capítulos, imágenes, y otros metadatos esenciales. Integración con el Tema Madara: Madara es un tema de WordPress diseñado específicamente para mangas y cómics, que permite presentar capítulos organizados en un formato de lectura amigable. Asegurar que todos los datos se integren correctamente en el tema Madara, incluyendo la organización de los capítulos y la asignación a categorías y etiquetas para mejorar la navegación y el SEO del sitio. Optimización de la Experiencia de Usuario (UX): Mejorar la experiencia de lectura en dispositivos móviles y de escritorio, permitiendo que los usuarios naveguen entre mangas, accedan a capítulos rápidamente y tengan opciones de auto-scroll o zoom en la lectura de imágenes. Implementar un sistema de búsqueda avanzado que permita a los usuarios encontrar mangas por género, demografía, título alternativo y otros criterios. SEO y Monetización: Optimizar cada página de manga y capítulo con descripciones, títulos y palabras clave para SEO, utilizando metaetiquetas que mejoren el posicionamiento en motores de búsqueda. Implementación de espacios publicitarios en áreas clave, tanto en la página principal como dentro de las páginas de capítulos, para maximizar la visibilidad de los anuncios y generar ingresos. Automatización y Escalabilidad: Configurar tareas programadas (cron jobs) para mantener el contenido actualizado de forma automatizada. Permitir que el sistema se expanda fácilmente para añadir nuevas fuentes de mangas, sin necesidad de grandes modificaciones. Panel de Administración Personalizado: Crear un panel en WordPress que permita al administrador del sitio configurar las fuentes de contenido, revisar y aprobar manualmente los mangas o capítulos extraídos, y gestionar los anuncios y opciones de SEO. Beneficios del Proyecto: Este sitio permitirá a los fanáticos del manga en español acceder a una biblioteca extensa, organizada y actualizada automáticamente. Además, el sistema de monetización con publicidad le dará al proyecto una base de ingresos constante, mientras que la optimización para SEO mejorará su alcance en motores de búsqueda.

Categoría Programación y Tecnología
Subcategoría Programación Web
¿Cuál es el alcance del proyecto? Bug o cambio pequeño
¿Es un proyecto o una posición? Un proyecto
Actualmente tengo Tengo el diseño
Disponibilidad requerida Según se necesite
Integraciones de API Otros (Otras APIs)
Roles necesarios Programador

Plazo de Entrega: No definido

Habilidades necesarias