D’entrée de jeu, j’aimerais souligner que les « dimensions conformes » sont une notion et non un élément technique. Vous aurez donc compris que vous ne retrouverez pas de tips & tricks ou d’exemples de code dans cet article mais bien une explication d’un concept d’intelligence d’affaires (BI). Dans cet article, je définierai pour vous le concept de dimensions conformes, je mettrai votre cerveau à rude épreuve avec un petit exercice et je vous partagerai un cas d’application des dimensions conformes.
Qu’est-ce qu’une dimension conforme?
Les dimensions conformes représentent un concept clé en intelligence d’affaires , plus particulièrement dans les modèles de données en étoiles [consultez cet article pour vous rafraichir la mémoire sur les modèles de données en étoiles]. Si nous définissons ce concept à haut niveau, on peut résumer que les dimensions conformes sont des dimensions qui sont partagées par plusieurs faits (processus). De cette manière, les données des différentes tables de faits peuvent être analysées et comparées entre elles avec les dimensions qui conforment (qui sont partagées). En général, les dimensions conformes ne sont définies qu’une seule fois dans une organisation. C’est en collaboration avec les équipes de gouvernance ou les les business matter expert qu’elles sont définies.
Le fait de bien identifier ces dimensions procurent plusieurs avantages dont les suivants :
- Constance analytique d’un jeu de données à l’autre (une version unique de la vérité).
- Réduction du temps de développement (la même dimension peut être réutilisée ou lieu d’être recréée).
Matrice de dimensions conformes
L’élaboration d’une matrice de dimensions conformes permet d’identifier l’ensemble des dimensions qui conforment à travers les processus d’une organisation. Avant d’implanter un modèle de données, il est toujours pertinent de réaliser cette matrice. Grâce à cette matrice, de gens moins techniques, par exemple des utilisateurs d’affaires, pourrons rapidement constater les analyses qu’ils seront en mesure de réaliser avec un modèle de données. Le tableau ci-bas montre un exemple de matrice de dimensions conformes. Vous remarquerez que les processus sont listés en lignes alors que les dimensions le sont en colonnes. Lorsque nous retrouvons un « X », cela signifie qu’un processus peut être analysée par la dimension. Par exemple, vous remarquerez que les ventes, la gestion des plaintes, les campagnes marketing, les envois ainsi que les retours peuvent tous être analysés par la dimension client. Ainsi, la dimension client est conforme à travers les processus énoncés ci-haut.

Petit exercice
Maintenant que vous savez ce qu’est une dimension conforme, pouvez-vous, dans le modèle de données ci-bas, identifier la ou les dimensions conformes?

Vous avez la bonne réponse si… vous avez répondu la dimension Date! Effectivement, la dimension Date est la seule dimension qui est partagée par les 2 tables de faits (Ventes et Budget). Les dimensions Client et Territoire ne sont que partagées avec la table de fait des Ventes.
Exemple d’application: présence de plusieurs jeux de données Power BI
Si vous disposez de plusieurs jeux de données Power BI (datasets), centraliser les dimensions conformes dans des dataflow Power BI devient très pertinent. De cette manière, les dimensions conformes peuvent être réutilisées à travers les différents jeux de données Power BI. En centralisant les dimensions conformes dans dataflow et en les important dans les jeux de données Power BI, cela évite la duplication de la même table (ex. : table de clients) dans différents jeux de données Power BI. Également, en ayant les dimensions conformes centralisées dans dataflow, nous nous assurons que les jeux de données Power BI contiennent tous les mêmes dimensions avec les bonnes règles d’affaires appliquées, permettant d’obtenir une version unique de la vérité. Un autre élément à ne pas sous-estimer, est la charge sur vos systèmes sources. En centralisant les dimensions conformes dans dataflow, les systèmes sources ne reçoivent des requêtes qu’une seule fois. Par exemple, si vous avez 2 jeux de données qui contiennent la table Dimension Clients, ces 2 jeux de données peuvent se référer à la dimension qui en centralisée dans dataflow au lieu de procéder à l’extraction directement du système source pour les 2 jeux de données.
C’est tout pour ce sujet! J’espère que cet article vous aura éclairé sur le concept de dimensions conformes et sa pertinence dans les modèles de données en étoiles.