Terminado

Ejercicio integración de datos

Publicado el 04 Noviembre, 2021 en Programación y Tecnología

Sobre este proyecto

Abierto

Necesito resolver una serie de ejercicios que se debe resolver utilizando distintas tecnologías, los puntos son 8, pero solo se debe realizar el ejercicio 7 con un solo nivel deseado.

Contexto general del proyecto

Ejercicio: 1) Me proporcionan 4 data set en CSV. 2) Me dan una VPN en Openvpn y con el que puedo hacer un cluster, para luego acceder al postgresql. 3) Me piden descargar Pentaho y JDK8. 4) Cargar los 4 archivos utilizando procesos PDI (Pentaho Data Integration), dentro de un esquema “stage” que previamente debes crear. Dicho proceso debe contar con las validaciones necesarias para la carga de los archivos en cuestión. 5) Crear un esquema “prod”, en el cual debes armar un modelo relacional, preferentemente dimensional estrella, en base a la fuente de datos mencionada anteriormente proveniente del esquema “stage”, poblando las tablas de este nuevo modelo que crees, con los tipos de datos adecuados. 6) Generar un DER con el modelo creado en el ítem anterior. 7)  Crear un tablero en PowerBI de forma libre con algunos indicadores claves, que apunte a un nivel gerencial/directivo, con la cantidad de páginas que consideren, y los FILTROS necesarios, en base a los siguientes niveles. 8) Finalmente deberás entregar por mail los siguientes ítems: Los Jobs y las transformaciones que utilices para realizar la carga de los archivos. El der que explicite la implementación en la bd postgresql. El archivo PBIX que contiene el tablero generado.

Categoría Programación y Tecnología
Subcategoría Data Science
Tamaño del proyecto Pequeño
¿Es un proyecto o una posición? Un proyecto
Disponibilidad requerida Según se necesite

Plazo de Entrega: No definido

Habilidades necesarias