Sobre este proyecto
it-programming / data-science-1
Abierto
Contexto general del proyecto
Ejercicio: 1) Me proporcionan 4 data set en CSV. 2) Me dan una VPN en Openvpn y con el que puedo hacer un cluster, para luego acceder al postgresql. 3) Me piden descargar Pentaho y JDK8. 4) Cargar los 4 archivos utilizando procesos PDI (Pentaho Data Integration), dentro de un esquema “stage” que previamente debes crear. Dicho proceso debe contar con las validaciones necesarias para la carga de los archivos en cuestión. 5) Crear un esquema “prod”, en el cual debes armar un modelo relacional, preferentemente dimensional estrella, en base a la fuente de datos mencionada anteriormente proveniente del esquema “stage”, poblando las tablas de este nuevo modelo que crees, con los tipos de datos adecuados. 6) Generar un DER con el modelo creado en el ítem anterior. 7) Crear un tablero en PowerBI de forma libre con algunos indicadores claves, que apunte a un nivel gerencial/directivo, con la cantidad de páginas que consideren, y los FILTROS necesarios, en base a los siguientes niveles. 8) Finalmente deberás entregar por mail los siguientes ítems: Los Jobs y las transformaciones que utilices para realizar la carga de los archivos. El der que explicite la implementación en la bd postgresql. El archivo PBIX que contiene el tablero generado.
Categoría Programación y Tecnología
Subcategoría Data Science
Tamaño del proyecto Pequeño
¿Es un proyecto o una posición? Un proyecto
Disponibilidad requerida Según se necesite
Plazo de Entrega: No definido
Habilidades necesarias