Go to file
2024-06-18 06:30:27 +02:00
dlt Feat: create pdf ingest pipeline 2024-06-18 06:26:51 +02:00
scripts Feat: adapt to new excel format 2024-04-15 11:59:45 +02:00
tests Feat: add ARgs and kwrds when intersepted 2024-02-21 08:46:11 +01:00
.gitignore Feat: add *.duckdb in gitignore 2024-06-18 06:30:27 +02:00
Makefile Feat: add commands in makefile 2024-06-11 17:54:25 +02:00
README.md Feat: première version en notebook 2024-02-17 05:28:42 +01:00
requirements.txt Feat: add commands in makefile 2024-06-11 17:54:25 +02:00

E(T)LT pour Plesna

Stages

  • Raw: fichiers les plus brutes possibles

    • historique (fichiers avant création datawharehouse)
    • pdf (depuis les agences)
    • banque (extract depuis le web)
    • patrimoine
  • Staging: importation des données brutes triées par années

    • locataire (fait)
    • charge (fait)
    • banque (fait)
    • patrimoine (dimension): description des lots
  • Gold: données enrichies (catégorie, lots...) et testée

    • locataire
    • charge
    • banque
    • patrimoine
  • DataMart: données organisées pour analyse

    • lot_<lot_id>_loyer: historique de tous les loyers du lot

    • lot_<lot_id>_travaux: historique de tous les travaux du lot

    • lot_<lot_id>_description: historique des identifications du lot

    • pnl_: agrégation des loyers, charges et banques par mois et immeuble