En el sector de las telecomunicaciones (altamente competitivo) la retención de clientes ha surgido como un aspecto de suma importancia para sostener y prosperar en el panorama empresarial. El fenómeno en el que los clientes cambian su lealtad de un proveedor de servicios a otro se conoce como fuga o rotación de clientes. La fuga de clientes es un desafío importante para las empresas de telecomunicaciones, que puede conllevar a la pérdida sustancial de ingresos y un aumento en los costos operativos, ya que adquirir un nuevo cliente generalmente es más caro que retener a uno existente. Además, una alta tasa de fuga puede ser a menudo una señal de insatisfacción del cliente, lo que puede afectar negativamente la reputación y el valor de marca de una empresa.
Para abordar este problema generalizado, aprovechar el análisis de datos y el aprendizaje automático se ha convertido en una estrategia prometedora. Al analizar los patrones y tendencias en los datos de los clientes, las empresas pueden predecir la fuga antes de que ocurra, lo que les permite implementar medidas para retener clientes y mejorar el nivel de satisfacción.
Desde el punto de vista de la ciencia de datos, el problema de fuga de clientes se puede resumir entonces en cómo desarrollar un sistema de clasificación automática que, a partir de información de un cliente, la ubique en una de las siguientes categorías:
Es posible que el cliente quiera cancelar sus servicios (Churn).
El cliente quiere continuar con los servicios suministrados (No Churn).
Para este problema usaremos la base de datos disponible en el siguiente enlace:
https://www.kaggle.com/datasets/blastchar/telco-customer-churn?datasetId=13996&sortBy=voteCount
Se deben construir dos modelos de clasificación automática, utilizando dos técnicas diferentes de aprendizaje automático. Esto significa que en la etapa de generación de hipótesis se deberán proponer varias formas de resolver el problema, de las cuales posteriormente se seleccionarán las dos hipótesis más prometedoras para su verificación y comparación.
Luego, se deben implementar las dos hipótesis seleccionadas, por lo tanto, el resultado de la verificación consta del desarrollo de dos modelos y de la comparación de los resultados obtenidos para identificar cuál sería la mejor solución obtenida.
Se debe desarrollar, en Python, el código necesario, usando la plataforma Google Colab.
En un archivo formato .ipynb deberá estar, tanto el código que construye los modelos, como el texto correspondiente al análisis de los resultados obtenidos.
Plazo de Entrega: No definido