Completed

Ejercicio integración de datos

Published on the November 04, 2021 in IT & Programming

About this project

Open

Necesito resolver una serie de ejercicios que se debe resolver utilizando distintas tecnologías, los puntos son 8, pero solo se debe realizar el ejercicio 7 con un solo nivel deseado.

Project overview

Ejercicio: 1) Me proporcionan 4 data set en CSV. 2) Me dan una VPN en Openvpn y con el que puedo hacer un cluster, para luego acceder al postgresql. 3) Me piden descargar Pentaho y JDK8. 4) Cargar los 4 archivos utilizando procesos PDI (Pentaho Data Integration), dentro de un esquema “stage” que previamente debes crear. Dicho proceso debe contar con las validaciones necesarias para la carga de los archivos en cuestión. 5) Crear un esquema “prod”, en el cual debes armar un modelo relacional, preferentemente dimensional estrella, en base a la fuente de datos mencionada anteriormente proveniente del esquema “stage”, poblando las tablas de este nuevo modelo que crees, con los tipos de datos adecuados. 6) Generar un DER con el modelo creado en el ítem anterior. 7)  Crear un tablero en PowerBI de forma libre con algunos indicadores claves, que apunte a un nivel gerencial/directivo, con la cantidad de páginas que consideren, y los FILTROS necesarios, en base a los siguientes niveles. 8) Finalmente deberás entregar por mail los siguientes ítems: Los Jobs y las transformaciones que utilices para realizar la carga de los archivos. El der que explicite la implementación en la bd postgresql. El archivo PBIX que contiene el tablero generado.

Category IT & Programming
Subcategory Data Science
Project size Small
Is this a project or a position? Project
Required availability As needed

Delivery term: Not specified

Skills needed