Sobre este proyecto
it-programming / data-science-1
Abierto
INTRODUCCIÓN:
Se trata de crear un bucle que consta de un árbol de decisión con la siguiente métrica:
Criterio: gini index
Máxima profundidad: variable
Minimo de datos para dividir: variable
Cualquier otra metrica consultar
PROCESO:
Paso 1
Los datos se dividen en tres ventanas temporales . Is –os-os2 variable
el árbol de decisión se entrena solo con los datos de la ventana is con un numero de indicadores variable aleatorios y se tiene que predecir una de las dos labels variable.
Se analizan todas las hojas creadas del árbol de decisión y se debe de devolver en un archivo txt el ¨camino¨ recorrido con los indicadores correspondientes de todas las hojas que cumplan los siguientes criterios (ver archivo a1 como ejemplo):
criterios para las hojas:
minimo % predictivo is os os2 variable.
Minimo datos is os os2 variable.
Minimo datos nuevos debe aportar al nuevo csv is os os2 variable.
Minimo K ratio is os os2 variable.
Nota: observese que para calificar a una hoja apta hay que comprobar los criterios de los indicadores en las 3 ventanas is-os-os2
se tienen que repetir la creación de árboles y el análisis de las hojas hasta que se cumpla el criterio de parada
criterio parada bucle: minimo datos is os os2 variable.
Una vez se termina este bucle se tiene que crear un nuevo csv con los datos filtrados por todos los ¨caminos¨ así como un txt con todas las métricas en is os os2 que han sido variables.
Paso 2
Se hace un bucle que repite el paso 1 pero tomando el archivo CSV creado en el paso anterior .
Las variables del paso 1 cambian al paso 2 por lo que se debe de poder elegir nuevos valores de antemano
PARA TERMINAR IMPORTANTE:
Poder poner una cola de ordenes con el mismo CSV o distinto CSV para poder dejar el ordenador trabajando
Contexto general del proyecto
Se trata de un único proyecto pera realizar un programa que sea capaz de analizar los datos de un archivo .csv
Categoría Programación y Tecnología
Subcategoría Data Science
Tamaño del proyecto Pequeño
¿Es un proyecto o una posición? Un proyecto
Disponibilidad requerida Según se necesite
Plazo de Entrega: No definido
Habilidades necesarias