< Retour aux actualités
Data

Avant de faire du Big Data, faites de la Data

Quand on parle de sujets tendances ces derniers temps, tous secteurs confondus, le Big Data est un terme qui revient régulièrement dans les échanges. Et pour cause, les perspectives de l’utilisation à grande échelle des données disponibles pour les entreprises sont impressionnantes. Que ce soit pour cibler encore plus finement des comportements clients, intégrer des historiques de ventes colossaux pour créer une prévision apprenante, les champs sont nombreux. Impossible donc de ne pas avoir eu dernièrement des discussions où les termes savants sont échangés comme garants de la maîtrise de sujets complexes mais tellement en vogue : IA, machine learning, deep learning, réseaux de neurones, ETL, SQL, … 

Nous ne reviendrons ni sur le potentiel du Big Data, ni sur sa définition, pas plus que sur des méthodologies. Aujourd’hui, nous revenons à la source : la Data. Parce qu’avant de se lancer bille en tête sur un projet de Big Data, il est important d’en avoir les moyens et donc des données ! Et c’est là que le bât blesse : peu d’entreprises ont le niveau de maturité minimum requis sur leurs propres données pour espérer avoir des résultats avec un projet Big Data. 

Mais comment savoir si mon entreprise est déjà assez structurée au niveau de la Data ? 

Nous vous proposons une grille de lecture en 4 parties ; 3 étant plutôt techniques et 1 culturelle. 

L’exhaustivité des Data

Si cela peut tomber sous le sens, il parait néanmoins essentiel de rappeler qu’un minimum syndical est requis sur ce volet quantitatif. Pour aller un peu plus loin, 2 axes sont essentiels à vérifier : nous parlerons de la complétude de la donnée et de sa profondeur.  

La complétude doit permettre de s’assurer que les données à disposition couvrent bien l’entièreté du champ métier à travailler. Si nous reprenons l’exemple des prévisions de ventes, il faudra s’assurer au préalable que les données à disposition comprennent des éléments clés nécessaires à une bonne analyse (les quantités, les références, la typologie, la famille, le rayon, la date, le lieu de vente…). 

 Concernant la profondeur, nous ciblons ici l’historique. En effet, pour s’assurer d’avoir une analyse pertinente, il faut pouvoir garantir un historique suffisant qui permette d’identifier notamment des effets de saisonnalité, mais aussi de dégager des comportements ou réactions à des évènements endogènes ou exogènes à l’activité. 

La qualité de la Data

L’exhaustivité c’est bien, mais la qualité c’est mieux ! Si la première partie est certes incontournable, l’étape de vérification et mise en qualité de la donnée est aussi importante qu’elle est minutieuse et fastidieuse.  

L’exemple de fiches produits est assez criant ou comment avoir autant de possibilités que de fiches (un poids qui sera parfois suffixé avec « g » ou « grammes » ou « gr » ou alors simplement la valeur numérique quand parfois c’est carrément l’unité qui peut changer et passer au kg !). Il s’agit donc ici de garantir un niveau de qualité qui va permettre une exploitation correcte. Pour les amateurs, les notions de mapping géographiques et de cohérences de mapping entre systèmes reviennent régulièrement. Si l’identification peut être facilitée par des traitements automatiques, la correction passe très souvent par des opérations manuelles longues et fastidieuses. 

L’extraction, le stockage et la mise à disposition

Une fois la donnée disponible en quantité suffisante et nettoyée de ses imperfections, vient l’étape d’extraction. Vous devez avoir une structure qui vous permette d’extraire, de stocker et de mettre à disposition la Data dans votre entreprise – le fameux ETL (Extract Transform Load). Ce mécanisme ne sera pas le même en fonction de l’utilisation future, il faudra déterminer les autorisations d’extraction (qui a le droit), la fréquence (pas besoin d’extraire tous les jours 5 ans d’historique) et l’espace de stockage cible pour mise à disposition.  

La culture Data

Culturellement, enfin, il est important que l’entreprise soit habituée à la Data, son importance, son utilisation et que tout le monde comprenne son intérêt pour le Business et les Opérations. Si le « Tout Data » n’est pas la solution, l’entreprise doit tout de même avoir des convictions partagées dans l’utilisation de ses données. Le Big Data donne de bien meilleurs résultats dans une entreprise Data Driven plutôt que dans une autre qui ne le serait pas. 

Vous savez donc ce qu’il vous reste à faire, et ceci rapidement : améliorer votre Data et Master Data Management, créer une architecture de données exploitable et préparer le changement culturel. Une fois tout cela fait, la première marche vers le déploiement du Big Data sera franchi ! N’hésitez pas également à vous rafraichir la mémoire avec notre article spécifique « Les 8 erreurs à ne pas faire en data visualisation », une application directe des préceptes évoqués ici !

8 erreurs à ne pas faire en data visualisation – Findle

Lucio, associé Findle

Lucio
Associé