Comprendre l’architecture Lakehouse en “médaillon” dans Microsoft Fabric :
Temps de lecture : 2 minutes

L’architecture en médaillon organise le Lakehouse en couches successives (zones) afin d’élever la qualité, la structure et la valeur métier des données à chaque étape.
Dans Microsoft Fabric, ce modèle s’implémente naturellement au-dessus de OneLake et du format Delta Lake (transactions ACID (Atomicité, Cohérence, Isolation et Durabilité), time travel, schéma évolutif), rendant les transformations fiables, reproductibles et auditables.
L’architecture de médaillon compte trois couches distinctes, également appelées zones :

1) Bronze : Données brutes :

- But : ingérer les données telles qu’elles arrivent (structurées, semi-structurées, non structurées), sans transformation autre que le minimum vital (horodatage, normalisation des colonnes techniques).
- Valeur : source de vérité d’origine, support du retraitement et de l’audit.
- Pratique Fabric : si la source est déjà dans OneLake / ADLS / S3 / GCS, utilisez des shortcuts pour éviter la copie et réduire les coûts/latences.
- Conseils : partition par date d’ingestion, catalogue clair (schémas/locations), contrôle de qualité en lecture (profiling, détection d’anomalies).
2) Argent (Silver) : Données validées

- But : nettoyer, normaliser, typer ; appliquer les règles de qualité (unicité, complétude, référentiels), conformer les entités (clients, produits, calendriers).
- Valeur : vue consolidée de l’entreprise, prête pour l’analytique et la réutilisation.
- Pratique Fabric : tables Delta structurées (lignes/colonnes), CDC/incrémental, gestion du schéma évolutif contrôlée, tests de qualité automatisés (notebooks/pipelines).
- Conseils : nomenclature stable (ex.
silver.sales.orders), contrats de schéma, lignée documentée.
3) Or (Gold) : Données enrichies & gouvernées

- But : modéliser au plus près des cas d’usage (tableaux de bord, IA/ML, self-service) ; appliquer les aggregations et business rules finales.
- Modèle : souvent étoile (faits/dimensions) pour performance et simplicité ; éventuelles vues matérialisées côté SQL.
- Consommation : Power BI (Direct Lake / DirectQuery), point de terminaison analytique SQL, notebooks.
- Conseils : sécurité (RLS/OLS côté modèle), étiquettes de confidentialité, approbation (Promu/Certifié/Référence), monitoring d’usage.

Laisser un commentaire
Il n'y a pas de commentaires pour le moment. Soyez le premier à participer !