Evaluando propuestas

Automatización de Procesos en Databricks

Publicado el 30 Julio, 2024 en Programación y Tecnología

Sobre este proyecto

Abierto

Hola buenos días,

La oferta solo está disponible para personas que sean de habal hispana y tengan dominio sobre la herramienta python en Databricks. A continuación planteo detallos del poryecto:

1. Se tiene una función desarrollada en python que al aplicarse a un dataset con features y target definidos el resultado son tablas resumen. Sin embargo, esto debe de paralelizarse de tal manera que al ingresarse 70 datasets el resultado trabaje en paralelo.
2. Las mismas bases anteriores servirán para estimar un modelo XGBoost de clasficación y considerar la optimización a través de hyperopt. Se debe de paralelizar las ejecuciones.

Contexto general del proyecto

Modelo XGBoost de clasficación en Databricks. Las ejecuciones se deben de realizar con un df de ejemplo numéricas de hasta 1,000 features y 1 target dicontómico.

Categoría Programación y Tecnología
Subcategoría Inteligencia Artificial
Tamaño del proyecto Pequeño
¿Es un proyecto o una posición? Un proyecto
Disponibilidad requerida Según se necesite

Plazo de Entrega: No definido

Habilidades necesarias