8 erreurs à ne pas faire en data visualisation
En moyenne, une entreprise dispose de plus de 400 sources de données gérées via 6 outils différents*. Si la tendance est à l’utilisation de la data avec des données toujours plus nombreuses provenant de sources variées, une question fondamentale se pose : comment en extraire les informations pertinentes ? C’est la problématique qu’adresse la data visualisation, qui prend une importance croissante dans le pilotage des différents services de l’entreprise, que ce soit la finance, la Supply ou le marketing. Sa raison d’être : mettre en avant des informations clés et visuelles pour une compréhension immédiate et une prise de décision simplifiée.
La maturité des entreprises grandit peu à peu et de nombreux projets de data modélisation et visualisation sont en cours ou voient le jour. Nos expériences sur le sujet nous ont permis de lister les points ci-après qui sont des exemples d’erreurs courantes commises au cours de la préparation, de la création ou de la pérennisation de modèles de data visualisation. Power BI ou encore Tableau sont des outils bien connus pour créer ce genre de modèles, mais les principes expliqués ci-dessous sont applicables plus largement.
1. Négliger l’étape de nettoyage des données
Etape clé permettant d’anticiper l’ajout ou l’actualisation de données, le nettoyage rigoureux des données est mené avant la phase de modélisation. L’objectif est de s’émanciper de tous les cas particuliers et exceptions possibles, qui ont tendance à « casser » les modèles. Etape cruciale, sa mise en œuvre est parfois fastidieuse car elle nécessite fréquemment un traitement manuel de la part de personnes sachantes qui garantissent la qualité de la donnée.
2. Oublier l’architecture de la modélisation
Une modélisation de données adéquate permet de lier les différentes tables entre elles de façon à pouvoir les exploiter au mieux et le plus simplement possible. Par ailleurs, construire un modèle dont l’architecture est claire facilite le développement post-création, la maintenance ainsi que la prise en main par d’autres collaborateurs. La question de la structure de la modélisation doit se poser au plus tôt, car plus il existe de liens entre des tables, plus l’architecture devient difficile à manipuler.
3. Se baser sur des fichiers sources complexes
La force de la BI – Business Intelligence – réside dans la création de liens entre les tables pour en tirer un maximum d’informations et de résultats. Pour cela, mieux vaut utiliser plusieurs tables de quelques colonnes brutes qu’un fichier Excel déjà compilé comportant déjà formules et calculs. En outre, travailler des données brutes est une garantie de qualité et de fiabilité puisqu’aucune transformation n’a pu les altérer.
4. Charger l’ensemble des données dans le front
Charger l’ensemble des requêtes dans le frontend a pour conséquence d’alourdir le tableau de bord sans lui ajouter aucune valeur, puisque certaines données permettent d’en calculer d’autres sans pour autant être utilisées lors de l’étape de visualisation. Il est très facile de bloquer le chargement de certaines tables dans le frontend, le tout est d’y penser !
5. Vouloir modéliser et visualiser trop d’éléments
Parce qu’un outil BI donne des possibilités infinies de modélisation et de visualisation, il est parfois tentant de vouloir analyser des données sous tous les angles possibles. Or, la bonne lecture du modèle est conditionnée par la capacité à n’y inclure que les éléments à fort impact, qui répondent à une problématique précise et à un besoin métier et sont donc à mettre en valeur. Des ateliers de travail et le développement de maquettes permettent de recueillir l’attendu exact et d’orienter le développement sur les éléments les plus pertinents.
6. Utiliser des tableaux comme principal mode de visualisation
L’objectif de la data visualisation est de mettre en avant des informations clés et visuelles pour une compréhension immédiate et une utilisation simplifiée. Il est donc préférable de privilégier les graphiques et cartes KPI aux tableaux, trop lourds en données pour être compris en un coup d’œil.
7. Oublier le sommaire
Le sommaire, comme l’agenda d’une présentation, est la porte d’entrée au contenu du document et aux messages à faire passer. Prévoir une page d’accueil simple avec des boutons renvoyant aux autres onglets permet de faciliter la navigation sur l’ensemble du modèle et sa compréhension globale.
8. Laisser les utilisateurs sans formation
Si les utilisateurs ne sont pas familiers avec l’outil utilisé, il est nécessaire de leur proposer une formation pour naviguer de manière fluide et découvrir les fonctionnalités principales. Même dans le cas où l’outil serait connu de tous, il serait dommage de ne pas proposer une formation pour présenter spécifiquement le modèle, ses objectifs et quelques cas d’usage, qui vont permettre aux utilisateurs de se projeter vis-à-vis de leur besoin propre. Les rôles et responsabilités entre l’utilisateur final, les keys users et les personnes en charge de la maintenance du modèle sont également à définir pour être énoncés clairement lors de ces formations.
Pour conclure
La création d’un modèle de données nécessite de la rigueur et une réflexion portée en amont de la réalisation. Outre les 8 exemples d’erreurs mentionnés ci-dessus à éviter, il est essentiel lors de chaque phase de la création d’un modèle de se référer à l’expertise métier, afin de faire parler au mieux les données. C’est un facteur clé dans le succès d’un projet BI, ce pourquoi il est nécessaire de créer du lien entre développement et besoin métier, ce dont nous nous assurons lors de nos missions chez Findle.
*d’après IDC et Gartner (2020)