Différence entre l'étoile et le schéma de flocon de neige

Différence entre l'étoile et le schéma de flocon de neige

L'entreposage de données est un système conçu pour stocker et organiser des données dans des référentiels centraux, y compris les données d'autres sources. C'est un concept de base de l'intelligence commerciale dans les modèles de base de données relationnels qui utilise des techniques analytiques pour intégrer les données commerciales dans une base de données centrale.

Il existe deux modèles architecturaux communs utilisés dans l'entreposage de données:

  • Schéma d'étoiles
  • Schéma de flocon de neige

Les deux sont les modèles de base de données multidimensionnels courants utilisés pour répondre aux besoins des grandes bases de données à des fins analytiques dans les entrepôts de données réelles.

Nous présentons une comparaison impartiale entre les deux pour mieux comprendre lequel est meilleur que l'autre.

Qu'est-ce que le schéma d'étoile?

Il s'agit du modèle architectural le plus courant et le plus largement accepté pour développer des entrepôts de données et des martes de données dans lesquelles les données sont organisées en faits et dimensions. Il s'agit du modèle architectural le plus simple dans lequel une table de faits est utilisée pour se référer à plusieurs tables de dimension, imitant un motif d'étoile.

Comme son nom l'indique, le diagramme ressemble à une étoile avec la table de faits au centre et des tables de dimension multiples qui enlèvent, créant un motif comme une étoile.

Il est également connu sous le nom de schéma de jointure Star et stocke tous les attributs d'une dimension dans une table de fait dénormalisée pour naviguer rapidement dans de grands ensembles de données multidimensionnels qui expliquent les temps de réponse de requête rapide.

Qu'est-ce que le schéma de flocon de neige?

C'est une extension du schéma d'étoile avec des fonctionnalités supplémentaires. Contrairement au schéma d'étoile, les tables de dimension dans le schéma de flocon de neige sont normalisées en plusieurs tables connexes.

Le modèle architectural représente un arrangement logique des tables dans une hiérarchie relationnelle de plusieurs à un où les tables de dimension multiples sont normalisées en tables de sous-dimension, ressemblant à un motif de type flocon de neige, d'où le nom.

Il s'agit d'une version plus complexe du schéma d'étoile avec plus de jointures entre les tables de dimension qui explique le temps de traitement lent pour récupérer les données, ce qui signifie des temps de réponse de requête lents. Il minimise la redondance des données qui à son tour améliore les performances de la requête.

Différence entre l'étoile et le schéma de flocon de neige

Architecture de schéma d'étoile et de flocon de neige

Dans les bases de données relationnelles, Star Schema est le modèle architectural le plus simple utilisé pour développer des entrepôts de données et des marts de données multidimensionnels. Comme son nom l'indique, le modèle ressemble à une étoile avec des points rayonnant du centre, ce qui signifie que la table des faits est le centre et les points sont les tables de dimension. Comme d'autres modèles dimensionnels, il se compose de données sous forme de faits et de dimensions. Le schéma de flocon de neige, en revanche, est le modèle architectural le plus complexe qui fait référence à une base de données multidimensionnelle avec une disposition logique des tables sous la forme d'un flocon de neige.

Table de dimension

Le schéma de flocon de neige est assez similaire au schéma d'étoile, sauf qu'il peut avoir plusieurs tables de dimension qui sont encore normalisées en plusieurs tables connexes appelées tables de sous-dimension. Il représente plusieurs niveaux de relations qui se transforment en un motif de flocon de neige. Cependant, le schéma d'étoile stocke tous les attributs connexes d'une dimension en une seule table de dimension dénormalisée, ce qui facilite la compréhension et la gestion des requêtes plus simples.

Modèle commercial de schéma de flocon d'étoile et de neige

Une table de dimension ne peut pas contenir des lignes en double dans les modèles de base de données relationnels pour le simple fait qu'il pourrait créer des ambiguïtés en récupération. Chaque table doit avoir une colonne ou une combinaison de colonnes appelées la clé principale qui identifie uniquement tous les enregistrements de table. Une clé étrangère est une colonne ou un groupe de colonnes qui fournit un lien entre deux tables. Dans le schéma étoilé, chaque table de dimension a une clé primaire qui est liée à une clé étrangère dans le tableau des faits. La hiérarchie des affaires dans un schéma de flocon de neige est représentée par une relation de clé principale / clé étrangère entre les tables de dimension.

Intégrité des données dans le schéma des étoiles et des flocons de neige

La principale différence entre les deux modèles de base de données relationnels est la normalisation. Les tables de dimension dans le schéma d'étoiles ne sont pas normalisées, ce qui signifie que le modèle d'entreprise utilisera relativement plus d'espace pour stocker des tables de dimension et plus d'espace signifie des enregistrements plus redondants, ce qui entraînerait une incohérence. Le schéma de flocon de neige, en revanche, minimise la redondance des données car les tables de dimension sont normalisées, ce qui explique des enregistrements redondants beaucoup moins. La hiérarchie des entreprises et ses dimensions sont conservées par l'intégrité référentielle que les relations de signification peuvent être mises à jour indépendamment dans les entrepôts de données.

Performance de requête

Le schéma étoilé a moins de jointures entre la table de dimension et la table des faits par rapport à celle du schéma de flocon de neige qui a plusieurs jointures qui expliquent moins de complexité de requête. Étant donné que les dimensions dans un schéma d'étoiles sont liées par un tableau de faits central, il a des chemins de jointure clairs qui signifient que les temps de réponse de requête rapide et le temps de réponse rapide signifie de meilleures performances. Le schéma de flocon de neige a un nombre plus élevé de jointures ainsi plus longues de temps de réponse des requêtes, ce qui se traduit par des requêtes plus complexes qui compromettent finalement les performances.

Schéma étoilé vs. Schéma de flocon de neige: tableau de comparaison


Résumé des vers d'étoiles Snowflake Schema

Les deux sont les modèles architecturaux les plus courants et les plus adoptés pour développer des entrepôts de base de données et des martes de données. Cependant, chaque modèle d'entreprise a sa juste part des avantages et des inconvénients. Bien que le schéma d'étoile soit le modèle multidimensionnel le plus simple utilisé pour organiser les données en faits et dimensions, il est idéal pour développer des martes de données qui impliquent des relations moins complexes. Snowflake Schema est une représentation logique des tables dans une base de données multidimensionnelle dans laquelle les dimensions sont stockées dans des tables de sous-dimension. La principale différence entre les deux est la normalisation. Les tables de dimension d'un schéma de flocon de neige sont complètement normalisées en plusieurs tables de recherche, tandis que dans un schéma d'étoile, les tables de dimension sont dénormalisées en une seule table de faits centrale.