Atelier d’idéation sur les Data Trucs

Salut les internautes,

Depuis plusieurs années le monde de la data est en effervescence, et son vocabulaire aussi : data product, data analyst, data engineer, data stewart, data mesh, data scientist, data driven, data product, data ops, …. tout un tas de data trucs !

Est-ce que cela concerne les activités des OPS ? Quels sont les impacts sur nos métiers ? Quels sont les implications pour le monde IT opérationnel ? Et d’abord c’est quoi ces data trucs ? Pour répondre à ces questions, nous avons réfléchi en collectif, guidés par un pro de la projection IT : Olivier Wulveryck. Olivier est venu animer un atelier d’idéation chez TECHSYS, et maintenant on sait répondre à nos questions. Je suis Sophie, et je vous partage la synthèse de ce que j’ai retenu.

Il existe deux mondes de la data

Le monde opérationnel

C’est le terrain de jeu historique de TECHSYS.

Côté opérationnel la donnée est partout : stockage, sauvegarde, bases de données, bigdata, données d’activité (traces, logs, …), données de performance (diagnostic, tests de performance, …). Ces données de production sont critiques parce qu’elles sont la source des données analytiques. Sans elle, pas d’analyse du passé, pas de prédiction sur l’avenir.

Les collaboratrices et collaborateurs de TECHSYS sont donc garants de la source des données critiques. Nous sommes les Gardiens de la Source Data ! (musique dramatique). J’aime bien. Ça claque 😊

Le monde analytique

C’est l’analyse des renseignements que l’IT possède sur l’activité métier, appelée Business Intelligence.

Les données sont regroupées et analysées pour comprendre l’activité passée et réaliser des prédictions sur le futur. Autant d’informations utiles aux équipes métiers pour rendre plus performante leur entreprise et leurs services numériques.

Des mondes étanches, mais pas pour longtemps

Entre opérationnel et analytique, les équipes sont différentes, leurs enjeux sont différents, leurs process sont différents. La donnée circule dans un seul sens : les données opérationnelles alimentent les sources de données de l’analytique, mais il n’existe pas ou peu de flux de données de l’analytique vers l’opérationnel.

C’est souvent vrai aujourd’hui, mais ce cloisonnement ne va pas faire long feu…

Le mur entre monde opérationnel et monde analytique est progressivement abattu, notamment par la tendance à remonter les enjeux business aux équipes opérationnelles, par la mesure de l’efficacité des services numériques. Vous voyez de quoi je parle ? L’ingénierie des sites, SRE ou Site Reliability Engineering.

Concernant le décloisonnement, je peux parler également du mouvement DevOps ou du paradigme datamesh. Comme eux la SRE s’inscrit dans les initiatives de destruction des murs qui cloisonnent les organisations IT. Une grande opération d’ouverture est en cours ! Plein de petits 9 novembre 1989 😊

Mais revenons à nos moutons data.

L’indigestion des entrepôts de données

Plus de données, toujours plus de données. Plus de formats différents. Plus de rafraîchissements des données, jusqu’à la minute. Plus de rétentions de données, jusqu’à plusieurs années. Les entrepôts de données, ou datawarehouse, souffrent de ce toujours plus et leurs performances en ont pâti.

Pourquoi vouloir toujours plus de données ?

Pour alimenter les modèles d’apprentissage, ou machine learning. C’est qu’il leur faut beaucoup d’historique pour réaliser des prédictions qui tiennent la route !

Pour avoir un recul maximal sur les performances de l’entreprise. Plus on connaît son passé, mieux on anticipe son avenir, non ? A l’heure de la concurrence digitale, il est difficile d’imaginer s’en passer… Les entrepôts de données grossissent donc, mais pas sans douleurs : déstructuration des données, goulet d’étranglement, explosion des volumes, … une vraie indigestion de données.

L’origine des data trucs

Heureusement de preux chevaliers sur leurs beaux destriers blancs sont venus soulager les douleurs des entrepôts de données ! tagada tagada … en les découpant en morceaux (aïe) :

Bim ! un grand coup de services cloud pour déstructurer le stockage.

Zling ! une autre massue cloud pour éclater les moteurs d’exécution.

Chlak ! des jeux de données distribués.

Taïaut ! sur les dialectes de manipulation des données.

Boum ! sur l’extraction et la conversion des données.

L’agilité, le décloisonnement des équipes IT, l’accélération du rythme d’évolution des services numériques, … la quête du passage à l’échelle des entrepôts de données est une frénésie d’adaptations, de nouvelles technos, de nouvelles gouvernances, de nouveaux métiers.

C’est l’origine des data trucs.

Des douleurs qui grattent

Pour clore notre atelier, Olivier nous a proposé d’échanger sur les problématiques que l’on rencontre chez nos clients. Découpées en morceaux, les sources de données analytiques vont mieux, mais sur le terrain nous constatons des problèmes qui grattent nos bonnes pratiques opérationnelles. Et Olivier a rajouté du poil à gratter. De quoi nous faire réfléchir en nous grattant…

L’obsolescence des composants d’infrastructure et des données

Maintenir les versions des composants d’infrastructure à jour, faire le ménage dans les données pour réduire les volumes, voilà deux missions que nous pensons aller de soi car en accord avec l’état de l’art du monde opérationnel.

Mais l’état de l’art n’est pas absolu, il doit s’adapter au contexte de chaque client, de ses moyens, de son historique, de ses enjeux, … peut-être est-il utile pour ce client de garder toutes ses données ? Peut-être assume-t-il le risque d’un composant obsolète ? Ce qui est important c’est de connaître et d’être conforme à l’état de l’art du client. Et rien ne nous empêche de conseiller nos clients sur la pertinence de son état de l’art en lui partageant nos convictions. N’est-ce pas notre devoir de conseil ?

Le poil d’Olivier

Le plat de spaghetti des flux applicatifs

Quelle galère de diagnostiquer un incident lié à un flux applicatif complexe ! Par où passent les instructions et les requêtes applicatives ? Quels composants sont concernés ? C’est souvent impossible d’obtenir l’information précise car les flux applicatifs sont mal documentés et mal tracés dans le monde opérationnel. Et on nous demande de garantir des niveaux services dans ces conditions ?!

Je n’ai vu aucune solution efficiente à ce jour. Aucune cartographie des flux maintenue dans le temps, aucune solution de traçabilité des flux mise en œuvre en production pour des raisons de coûts ou de complexité. Mais si un niveau de service attendu ne peut pas être garanti par manque de maîtrise de son périmètre opérationnel, c’est qu’il est mal défini, il doit être découpé. T’as des ciseaux ?

Le poil d’Olivier

La multiplication des outils

Les équipes sont de plus en plus autonomes pour mettre en place leurs composants d’infrastructure et leurs outils, on fait même tout pour cela ! En résulte une augmentation de l’hétérogénéité des technologies, un maintien en condition opérationnel complexe, des risques de sécurité accrus, des doublons de solutions, des coûts en croissance, des freins à l’homogénéisation, et j’en passe… et côté opérationnel, nous sommes garants de la qualité de ces services en multiplication anarchique. Si ça continue, va falloir que ça cesse !

Le foisonnement technologique est un signe d’innovation numérique. C’est une bonne nouvelle ! C’est l’anarchie de ce foisonnement qui te pose des problèmes. Elle est révélatrice d’une défaillance de gouvernance : définition de la stratégie IT, des tactiques de sa mise en œuvre et de l’état de l’art qui donne le cadre. Voilà ce qu’il te manque. Il s’agit souvent d’un problème de communication : est-ce que cet état de l’art existe chez ton client ? Cherche-le et sois un facilitateur de sa diffusion pour combattre la multiplication anarchique des outils.

Le poil d’Olivier

Je trouve amusant que les problématiques que l’on a levées en atelier ne trouvent pas de solution dans notre périmètre d’intervention qu’est le monde opérationnel. Cela renforce ma conviction que nous, les OPS, avons tout à gagner à abattre les murs des organisations IT par l’agilité, le devops, la SRE, et toute autre initiative qui s’apparente à une masse organisationnelle qui abat les cloisons entre équipes.

En conclusion

Il existe une promesse de l’intelligence artificielle : elle permettra au monde analytique de modifier dynamiquement les services numériques du monde opérationnel et ainsi maximiser le business. Je me méfie de cette promesse. Comme d’autres j’ai été déçue par le machine learning au regard du manque de pertinence des projections réalisées, ou de leurs coûts ! Mais c’est une belle promesse…

En attendant chez TECHSYS nous entretenons nos expertises du monde opérationnel et participons à tous les décloisonnements de l’IT : devops, SRE, data driven, … Gardiens de la Source Data, Chevaliers du passage à l’échelle des infrastructures, notre quête d’un meilleur IT se poursuit 😊


Auto