Sobre este proyecto
it-programming / others-5
Abierto
Con base en un conjunto de datos, se busca predecir la admisión universitaria y la aceptación de cupos utilizando algoritmos de machine learning como k-means y random forest. El proceso iniciará con la limpieza y preparación de los datos, seguido del entrenamiento y evaluación de modelos. Finalmente, se creará un dashboard en Power BI para visualizar los resultados y comparar la eficiencia de los diferentes algoritmos.
El dataset tiene N cantidad de variables con 2 variables predictoras, la primera es si se le va a asignar cupo o no, por lo tanto la primera predicción es la asignación de cupo. Luego con la predicción de esa variable, se hará una segunda predicción cupo aceptado (si va a aceptar o rechazar el cupo asignado). En resumen hay que realizar una predicción y de ese resultado realizar otra predicción.
El entregable es de varias cosas:
1. Un .ipynb con todos los pasos a seguir documentando cada etapa, se deben de aplicar 4 tipos de algoritmos de ML (random forest, k-means, XGBoost y una red neuronal, ejemplo CNN). Además de afinar usando hiperparámetros, usar métricas de evaluación para elegir el mejor algoritmo.
2. Todo tipo de plots que ejemplifiquen todo lo realizado para el análisis (dentro del .ipýnb)
3. Dashboard en Power BI interactivo con las predicciones finales
- De ser preferible usar la librería scikit-learn.
- Dataset aproximadamente de 100k de registros y 40 variables incluidas las 2 predictoras.
Por favor revisar los documentos adjuntos para el contexto general y específico del proyecto.
Categoría Programación y Tecnología
Subcategoría Otros
Plazo de Entrega: No definido