Blog

DataOps – Optimiser la gestion des projets de données

January 31st, 2022  by Marc Husquinet

La donnée est clairement le nouvel or noir des organisations. Encore faut-il collecter, traiter et analyser la donnée pour la transformer en une information pertinente pour le métier. Tel est le défi de la DataOps, une nouvelle approche de la gestion de projets data.

All articles

Selon la définition du cabinet Gartner, le DataOps est « une pratique de gestion collaborative des données destinée à améliorer la communication, l’intégration et l’automatisation des flux de données entre les gestionnaires de données et les utilisateurs métier dans l’organisation. » L’objectif du DataOps consiste à délivrer plus rapidement de la valeur et à mieux prévoir la fourniture et la gestion des données, des modèles de données et des traitements de données. « Le DataOps fait appel à des technologies pour automatiser la conception, le déploiement et l’exploitation des fournitures de données avec les niveaux de gouvernance appropriés, et s’appuie sur des métadonnées pour améliorer l’exploitabilité et la valeur des données dans un environnement dynamique.

Défis

A l’heure où la transformation numérique doit permettre aux entreprises de gagner en efficacité, tant opérationnelle que financière, et en compétitivité, il est indispensable de mettre la donnée au centre de tous les processus. Or les structures des entreprises sont encore trop souvent en silos, tandis que l’alignement entre le métier et les équipes informatiques n’est pas toujours idéal. De même, les projets de données restent guidés par une démarche artisanale et ne sont dès lors source de gaspillage tant en énergie qu’en budget. Enfin, les technologies mises en œuvre dans de tels projets data sont encore trop fragmentées et peu matures, ce qui implique une prise de risque importante pour l’organisation.

Pour encadrer de tels projets, deux méthodologies désormais assez bien connues doivent être mises en place. D’abord, le DevOps qui implique un alignement étroit entre équipes de développement et d’exploitation IT. L’accent est mis sur la collaboration et la communication en automatisant le processus de livraison de logiciels et de changements d’infrastructure, et favorise donc une meilleure communication entre les équipes. L’autre axe est la méthodologie agile. En fait, le, le déploiement agile vous permet au fil des itérations du projet de gérer les changements de priorités et la validation tout au long du projet de développement, ce qui vous en assure la propriété et le contrôle.

En pratique

Pour assurer la réussite d’un tel projet, plusieurs éléments doivent être pris en compte. La gouvernance des données ainsi que la sécurité des données et des opérations sont deux aspects à mettre en avant, de même qu’une intégration et un traitement fluides des données. En outre, la visibilité des données devra être garantie et des fonctions de self-service devront être disponibles pour les utilisateurs finaux.

Le DataOps présente de nombreux avantages. Ainsi, il améliore la productivité et accélère la mise en production de projets de données. La collaboration s’en trouve améliorée et le besoin de compétences techniques ultrapointues s’en trouve réduit. Le taux de réussite d’un tel projet augmente, de même que la satisfaction globale tant des équipes que des décideurs.

Cela étant, et comme beaucoup de technologies innovantes, le DataOps se heurte à certaines réalités. Ainsi, la valeur d’un tel projet reste difficile à démontrer. De même, les délais d’implémentation sont longs. Du coup, rares sont les projets qui sont réellement déployés en production.

Par étapes

Pour être une réussite, un projet DataOps doit se faire par étapes pour automatiser la conception, le déploiement et la gestion des flux de données, le tout dans le respect de la gouvernance et des métadonnées. Un pipeline de données devra donc être mis en place depuis l’extraction jusqu’à la visualisation par le métier.

Le rôle du DataOps sera précisément d’orchestrer et d’automatiser ce pipeline selon un principe de boucles : un sandbox avec les données brutes pour une analyse sommaire des données ; un staging qui affinera l’analyse après nettoyage et documentation pour obtenir les premiers modèles ; et la mise en production des modèles pour leur exploitation par les utilisateurs.

Aprico Consultants est une société de conseil spécialisée dans l'architecture et la transformation des systèmes d'information. En accélérant résolument les processus de transformation numérique, la société fournit à ses clients la flexibilité, la performance et la compétitivité nécessaires pour leur permettre de renforcer leur position sur le marché. Aprico Consultants collabore avec ses clients pour traduire la stratégie de l'entreprise, ses objectifs et ses contraintes en programmes de transformation pragmatiques qui délivrent une véritable valeur ajoutée et un retour sur investissement avéré.

Careers opportunities

We’re always looking for talented people.
Are you one of those?