Si vous baignez dans le monde de la donnée, vous avez assurément entendu parler de la nouvelle 7e merveille du monde avec l’annonce de Microsoft Fabric lors de l’événement Microsoft Build 2023. Chez ventriloc, ça n’a pas passé inaperçu du tout! Nos experts travaillent déjà activement à se faire les dents avec ce nouvel outil et tentent de définir les meilleures pratiques et d’identifier dans quel contexte Microsoft Fabric peut s’insérer dans le processus décisionnel de nos partenaires.
Dans cet article, vous découvrirez à haut niveau Microsoft Fabric. Je donnerai également mon opinion sur l’outil et à quel point il peut vous impacter en tant que professionnel dans le monde de la donnée. Comme c’est nouveau, assurez-vous de suivre notre blog, de nouveaux articles sur le sujet suivront dans les prochains jours et mois afin de vous tenir informé de la progression de Microsoft Fabric, de nos découvertes et des bonnes pratiques de mise en place!
C’est tout nouveau, c’est tout beau mais ça mange quoi en hiver Microsoft Fabric?
En résumé, Microsoft Fabric est une plateforme unifiée qui centralise plusieurs services (existants et nouveaux) de Microsoft comme le démontre la figure 1. Pour ceux qui connaissent déjà bien l’écosystème analytique de Microsoft, vous avez sans doute constaté que plusieurs composantes dans la figure 1 existaient déjà avant l’arrivée de Microsoft Fabric. Effectivement, on remarque que seulement Data Activator et OneLake sont des nouveautés.
Figure 1 – Les fonctionnalités de Microsoft Fabric
Avec Microsoft Fabric, il ne sera plus nécessaire d’acquérir différentes composantes de manière unitaire alors que tout sera centralisé à un seul endroit, ce qui représente un gros avantage. Avec cet avantage en vient un autre, soit le fait que les différents professionnels de la donnée (ex. : ingénieur de données, architecte de données, scientifique de données, analyste BI, etc.) pourront désormais collaborer dans un seul outil. Un outil intégré pour tous les professionnels, chez ventriloc, on aime ça 😊.
Encore un fois, c’est bien beau tout ça mais qu’est-ce qui est game changer?
Ici, je vous fais part de mes opinions en fonction de mes expériences passées et de mes connaissances actuelles de Microsoft Fabric. Je vois déjà quelques gros avantages à utiliser Microsoft Fabric. Voici les plus frappants selon moi :
1. L’introduction du concept de OneLake.
Ce concept est à la base même du plus grand défi en BI, soit une version unique de la vérité. Chaque organisation qui utilisera Microsoft Fabric ne pourra détenir qu’un seul OneLake, il sera impossible d’en détenir plusieurs. Cela représente un pas de plus vers la centralisation de toutes les données d’une organisation. Également, OneLake ne sera pas exclusivement réservé à des gens techniques puisque les données sont structurées de la même manière que dans un OneDrive. Cela favorisera la démocratisation de l’accès aux données pour les utilisateurs d’affaires qui n’ont pas de compétences techniques.
2. CoPilot
Vous ne savez pas comment écrire votre mesure complexe en DAX? Demandez à CoPilot, il le fera pour vous! Assurez-vous par contre de valider que le résultat est bien ce que vous souhaitez puisque CoPilot n’a pas toujours raison.
Vous voulez créer un nouveau rapport Power BI mais vous avez le syndrome de la page blanche? Demandez à CoPilot, il le fera pour vous!
Vous trouvez que le rapport que vous avez créé n’est pas visuellement attractif et vous aimeriez qu’il ressemble à un rapport qu’un de vos collègues a développé? Demandez à CoPilot d’ajuster le design de votre rapport pour qu’il s’apparente à celui de votre collègue!
Je pense que je n’ai pas besoin de vous convaincre davantage, vous avez sans doute compris que CoPilot a le potentiel de devenir votre meilleur ami.
Par contre, afin que CoPilot puisse vous guider efficacement, vous devez disposer d’une couche sémantique irréprochable. Par irréprochable, je veux dire que vous devez donner des noms explicites à vos tables, colonnes et mesures afin que CoPilot puissent coupler vos questions avec votre couche sémantique. Par exemple, si vous demander à CoPilot de générer un rapport des ventes sur un jeu de données mais que votre mesure qui représente vos ventes s’appelle « Value », CoPilot ne saura pas où récupérer les ventes.
3. Data Activator
Encore un nouveau joujou signé Microsoft! Avec Data Activator, vous pouvez avoir la tête tranquille et éviter de devoir scanner les 56 rapports dans votre organisation à la recherche d’anomalies dans vos données car Data Activator le fera pour vous. Effectivement, Data Activator permet de mettre en place un système de monitoring et d’alerte afin de vous avertir lorsqu’une anomalie est rencontrée dans vos données. N’est-ce pas le rêve de tous gestionnaires?
4. Le nouveau mode de connexion aux données Direct Lake Mode dans Power BI.
Pour ceux ayant travaillé avec Power BI, lorsqu’on veut importer des données dans Power BI, on se résorbait entre 2 principaux modes de connexion, Import ou Direct Query. Comme l’illustre la figure 2 ci-bas, le mode Direct Query permet de disposer de données en temps réel mais la performance n’est pas au rendez-vous alors que le mode import permet une grande performance mais nécessite de dupliquer les données de vos systèmes dans Power BI en plus de ne pas permettre du temps réel.
Figure 2 – Modes de connexion Power BI, introduction du Direct Lake Mode
Vous n’aurez plus à vous casser la tête, vous pourrez maintenant opter pour le nouveau mode de connexion, le Direct Lake. Celui-ci combine les avantages des méthodes Direct Query et Import et fait abstraction des désavantages des 2 méthodes. Oui, oui, vous avez bien compris! Plus besoin de faire un compromis entre performance et données en temps réel.
5. L’intégration de GIT pour les artefacts Power BI
Un autre killer feature selon moi est l’apparition de GIT pour Power BI. On le sait tous, les datasets, les rapports et les dataflow, ça évolue au fil de temps. Comment conserver un historique de toute cette évolution? Comment revenir sur une version antérieure de dataflow? Comment travailler plusieurs sur ces différents artefacts? La réponse parfaite n’existait pas il y a à peine quelques jours mais elle existe désormais et elle se nomme GIT. GIT a toujours existé mais il n’était pas possible de jumeler les artefacts Power BI et Git puisque les formats des artefacts Power BI n’étaient pas compatibles. Maintenant, vous pouvez versionner toutes les modifications faites à vos artefacts Power BI, travailler à plusieurs et faire du roll back sur des versions antérieures en presqu’un claquement de doigt!
« Microsoft Fabric permet à vos équipes d’utiliser vos données au sein d’une solution centrale. »
Ok, je suis vendu Microsot Fabric, mais ça coûte combien?
À cette heure, aucune donnée et information existantes sur le pricing n’a été communiquée par Microsoft de manière officielle. Toutefois, nous avons été en mesure d’obtenir une idée des chiffres qui devraient être communiqués sous peu. On vous présente dans l’article Microsoft Fabric, combien ça coûte? en détail les coûts auxquels vous devez vous attendre.
En conclusion
Chez, ventriloc, nous sommes emballés à l’idée de travailler dans Microsoft Fabric et y voyons déjà plusieurs opportunités d’améliorations pour nos partenaires actuels. Une chose est certaine, je crois que Microsoft Fabric bouleversera la manière dont nous travaillons tous actuellement avec les outils analytiques de Microsoft. Par contre, comme avec n’importe quel autre outil, il est facile de perdre le contrôle rapidement si nous ne définissons pas de bonnes pratiques et des méthodes de travail spécifiques à Microsoft Fabric. Cela passe nécessairement par la mise en place d’une solide gouvernance autour de l’utilisation de Microsoft Fabric.
Pour conclure, ventriloc continuera de travailler très fort pour vous tenir informé et vous conseiller dans votre migration vers Microsoft Fabric. D’ici là, je vous encourage à activer l’essai gratuit de 60 jours de Microsoft Fabric et nous faire part de votre opinion!