Planteamiento del problema:
Una empresa farmacéutica recopila datos para un estudio de mercados, donde desea conocer qué medicamento podría ser apropiado para un futuro paciente. Los datos se realizaron sobre una muestra de 200 pacientes, los cuales todos sufrían de la misma enfermedad. Durante el curso de su tratamiento, cada paciente respondió a uno de los cinco (5) medicamentos (Medicamento A, Medicamento B, Medicamento C, Medicamento X y Medicamento Y).
Parte de su trabajo es construir un modelo para averiguar cuales es el medicamento más eficaz que contrarresta los efectos negativos de la enfermedad (el objetivo es encontrar el mejor medicamento al que respondió cada paciente). Las características de este conjunto de datos son la edad del paciente, el sexo, la presión arterial, el nivel de colesterol y la concentración de sodio y potasio en la sangre.
Con lo anterior, usted puede usar la parte de entrenamiento del conjunto de datos para crear un árbol de decisión y posteriormente usarlo para predecir la clase de un paciente desconocido o para prescribir un medicamento a un nuevo paciente.
Origen de datos: IBM
Se trabajará con el Dataset “Medicamentos A, B, C, X, Y para árboles de decisión” (
https://www.kaggle.com/datasets/pablomgomez21/drugs-a-b-c-x-y-for-decision-trees?select=drug200.csv)
Para la presentación de la actividad, adjuntar el archivo de RStudio o Python del código y un documento en Word donde realice un análisis soportado con gráficos e interpretación de cada uno de ellos según el caso “Medicamentos A, B, C, X, Y para árboles de decisión”.
Contexto general del proyecto
Trabajo para la universidad materia análisis de datos, necesito una persona experta ya que se debe entregar 14 de diciembre.
Plazo de Entrega: 14 Diciembre, 2024