Retour

Stockage & modèles de données : Lakehouse vs Warehouse

Temps de lecture : 3 minutes

Dans Microsoft Fabric, deux objets couvrent les principaux modes de stockage et de traitement analytique : le Lakehouse et le Warehouse.

Lakehouse :

Un Lakehouse dans Microsoft Fabric combine la flexibilité d’un Data Lake avec les capacités analytiques d’un Data Warehouse. Il stocke les données au format ouvert Delta Lake (Parquet) dans OneLake, permettant à la fois l’ingestion massive de données brutes et l’analyse structurée. Il supporte une architecture médaillée (Bronze, Silver, Gold) et offre un accès multi-protocole via Spark, SQL Endpoint automatique et Power BI en mode DirectLake, ce qui le rend idéal pour l’exploration, la préparation de données et les scénarios de data science.

Warehouse :

Un Warehouse dans Microsoft Fabric est un entrepôt de données optimisé pour les requêtes analytiques . Il propose un modèle relationnel structuré (tables, vues, procédures stockées) avec un moteur SQL pour l’analytique. Il offre une gouvernance renforcée et une sécurité au niveau des lignes/colonnes, avec une compatibilité T-SQL complète, ce qui le rend idéal pour la consommation BI et les rapports d’entreprise.


Ils s’appuient tous deux sur OneLake, mais répondent à des besoins différents en termes de préparation, de gouvernance et de consommation BI.

CritèreLakehouseWarehouse
RôlePréparer et unifier des données variées (souvent des fichiers).Organiser et servir un modèle d’entreprise stable pour les tableaux de bord.
Types de donnéesFichiers (CSV, Excel, logs) + tables Delta.Tables relationnelles structurées.
Accès aux données / langageLecture SQL possible ; préparation surtout via notebooks (Spark).SQL complet (T-SQL), procédures et transactions.
Performance & volumeAdapté à des volumes importants et des chargements réguliers de fichiers.Prend en charge de nombreux utilisateurs en même temps et des requêtes régulières.
Sécurité& gouvernanceContrôles d’accès par équipes ; filtrage côté modèle BI.Affichage filtré par utilisateur, avec possibilité de masquer les colonnes sensibles au niveau des tables/vues.
Coûts & exploitationCoût d’entretien des tables Delta (éviter les petits fichiers, compacter/optimiser).Coût lié aux requêtes SQL et aux chargements réguliers des données .
Mises à jour & transactionsMises à jour SQL limitées ; préférer les transformations Spark pour modifier les données.Mises à jour et transactions rapides (jointure/mise à jour /suppression ) sur les tables.
Évolution du schémaFlexible (ajouts/évolutions) mais nécessite des règles de schéma pour éviter les ruptures.Schéma encadré et stable (règles strictes, adapté au long terme).
Cas d’usage typiquesQuand on part de fichiers, qu’il faut préparer et intégrer des sources variées (flexibilité, multi-cloud via raccourcis).Quand on veut un modèle d’entreprise stable, indicateurs certifiés et beaucoup d’utilisateurs.
à éviterMultiplication de petits fichiers, schémas changeants sans contrat.Tout faire en T-SQL si la préparation est lourde (mieux la faire en amont dans le Lakehouse).

Laisser un commentaire

Il n'y a pas de commentaires pour le moment. Soyez le premier à participer !