Il fut un temps où l’on pouvait avoir, même dans l’espace public, plusieurs identités. Avec les réseaux sociaux et plus généralement les technologies de traçage permanent de nos faits et gestes, du fait de notre activité (données que nous cédons aux GAFAM volontairement même si ce n’est pas toujours conscient) ou du fait de la dictature technologique qui s’est installée (cookies, cyberattaques, caméras de surveillance ou simples smartphones qui, insatiables, captent, captent encore et captent toujours), cette liberté d’antan n’est plus de mise. Je me suis personnellement fait rappeler à l’ordre plus d’une fois, par Google ou par Microsoft, pour m’être autorisé quelques fantaisies dans mes nom, prénom et date de naissance sur plus d’un compte en ligne. Et que serait-ce si je fréquentais les réseaux sociaux, ce que, à l’exception de LinkedIn, je ne fais pas et n’ai pas l’intention de faire.

Il est assez évident du reste que tout ce que j’écris sur ce blog est nourri par mon expérience professionnelle de records management/archivage managérial/gouvernance des données engageantes/gestion des risques informationnels (tout cela, c’est peu ou prou la même chose). De même que mon activité professionnelle et mes cours s’appuient sur ma réflexion continue sur la société de l’information aujourd’hui, hier, demain…

Ceci pour dire que Marie-Anne Chabin blogueuse, et Marie-Anne Chabin expert en archivage / gouvernance de l’information engageante / Marie-Anne Chabin professeur associé à l’université sont une seule et même personne. Ce qui me conduit donc à parler ici de mon activité professionnelle et de mon enseignement, au moins sur un aspect précis de cette activité qui est la méthode Arcateg™ à l’occasion de la nouvelle formation en ligne.

Arcateg™ est une méthode de gouvernance des informations à risque au sein d’une organisation ou d’une entreprise, les informations à risque étant les traces des échanges de cette organisation ou de cette entreprise qui, le plus souvent, engage la responsabilité de ladite organisation ou de ladite entreprise parce que ces traces prouvent un fait, une intention, une promesse, une obligation, un droit. Et que cette responsabilité dure un certain temps. Et que si ces traces ne sont pas gérées, l’organisation ou l’entreprise s’expose à un risque juridique, financier, médiatique ou autre. Et que la gestion de ces traces dans la durée exige certaines connaissances et certains savoir-faire qui ne s’improvisent pas.

Or, si on peut observer ici et là des pratiques de gestion de ces traces et de ces risques, elles sont le plus souvent expérimentales, partielles, inopérantes ou dépendantes d’une technologie sans conscience. Arcateg™ est, sauf erreur de ma part, la seule méthode simple et complète pour gouverner les traces engageantes, ce qu’on appelait jadis les documents d’archives, avant que le mot archives ne soit dévoyé vers d’autres sphères (mais c’est un autre sujet). Arcateg™ propose un cadre de classement universel et pérenne des valeurs informationnelles et un mode opératoire aussi souple que rigoureux pour mettre en œuvre la méthode dans tout le périmètre de l’entreprise, quelles que soient son activité, son histoire et sa taille. J’ai longtemps prêché la méthode australienne DIRKS (Designing and Implementing RecordKeeping System) créée à la fin du 20^e siècle mais elle s’est avérée trop complexe et elle n’englobait pas le pilotage des règles définies. D’autres méthodes viendront, du moins je l’espère car la comparaison des choses est toujours un plus pour l’intellect et le progrès.

Ce que je veux souligner dans ce billet est que la méthode Arcateg™ s’appuie sur une philosophie de l’information, ce que je pourrais appeler aussi amour du bon sens face à la réalité de l’information au 21^e siècle. C’est cette philosophie de l’information que je présente dans ce billet autour de trois slogans, et les lecteurs sont invités à poursuivre en suivant la formation en ligne « Construire son référentiel Arcateg™ en 10 étapes« .

Des traces d’échange bien plus que des documents statiques

Des documents aux traces. Le titre de mon de mon livre sur la méthode paru en 2018, Des documents d’archives aux traces numériques. Identifier et conserver ce qui engage l’entreprise – La méthode Arcateg™ (éditions KLOG) évoque déjà ce « changement de paradigme » (l’expression est un peu usée aujourd’hui mais il s’agit bien d’une évolution majeure des concepts de référence pour la gestion de l’information engageante dans la durée, autrement dit le fait de devoir conserver de manière sécurisée et accessible les « objets documentaires » qui résultent de l’activité humaine et qui portent la preuve ou la mémoire de ce qui a été dit, décidé, convenu, constaté, etc.).

C’est toute la nuance entre archivage et gestion des archives. Je me réjouis à cet égard du titre du master de l’université de Saint-Quentin-en-Yvelines : « Gestion des archives et de l’archivage » dû à la perspicacité de Christine Martinez et Pauline Lemaigre-Gaffier, car il met bien en lumière deux activités professionnelles distinctes et complémentaires, celle de mettre en archive ce qui mérite d’être préservé, puis celle de traiter, conserver et mettre les collections à disposition des chercheurs (professions bien différenciées en anglais par les mots très évocateurs records manager et librarian).

Il fut un temps où les documents d’archives dont il fallait prendre soin étaient majoritairement des objets physiques et matériellement stables, des objets cohérents (créés par des personnes formées à la rédaction des actes), des objets identifiés par tous les utilisateurs comme des objets importants pour la poursuite des activités et la défense des droits. Ces objets n’étaient pas si nombreux, souvent constitués dès le départ en collections chronologiques (les arrêtés, les contrats, les rapports…) ou en dossiers homogènes et sobres.

Mais le Diable, qui a inventé la photocopieuse puis les réseaux sociaux, est passé par là… Les acteurs et, partant, les activités se sont démultipliées, avec une complexification du droit faisant face à un défaut croissant de maîtrise de l’écrit. Les outils mécaniques puis technologiques ont conduit à produire cinquante ou cent exemplaires d’une même information au point que les utilisateurs rament ou pataugent jusqu’aux cuisses dans les versions et autres copies mal nommées. L’information en se numérisant a été atomisée (là on où avait naguère un document sur une feuille de papier, on a aujourd’hui une centaine de fichiers partiels, mal fagotés ou inutiles).

Laissons le Diable et le bon Dieu au domaine de la foi et restons dans celui de l’efficacité professionnelle. Les archives ne sont rien en soi. Elles sont le fruit d’une activité humaine (je dis parfois qu’elles sont une sécrétion humaine mais cela nous poussent vers le domaine médical qui n’est pas non plus le bon). Ce n’est pas par le fruit que constituent les archives qu’il faut… (le fruit, hum, domaine agricole…). Je reprends : ce n’est pas par le résultat qu’il faut prendre le problème de l’archivage mais par le processus, en ayant bien conscience que nous vivons en 2021 et non en 1950 ! Ce résultat informationnel est indissociable des organisations et des technologies en usage dans la société. C’est pourquoi j’utilise le mot trace qui veut évoquer à la foi le résultat du processus et la forme nouvelle que prend ce résultat par rapport à ce qu’il était aux époques précédentes.

Alors, bien sûr, si on attend la décrue pour voir quelles alluvions documentaires seront déposées sur le bord des services ou des serveurs, on sera face à un vrac dont la représentativité sera quasiment impossible à déterminer a posteriori. même si on peut en fabriquer une de toutes pièces pour se faire plaisir.

Certains archivistes qui s’échinent à récupérer ces alluvions et à trier des vracs déplorent dans le même temps d’être, toujours et encore, considérés comme des éboueurs documentaires. Personnellement, je ne m’en étonne plus depuis des lustres. Hélas. Trois fois.

Des données, des données… Oui, mais liées, datées, contextualisées

Partir de la constitution de la trace pour comprendre ce qu’il faut archiver et le mettre en œuvre, c’est aujourd’hui partir des données.

Nous vivons, qu’on le veuille ou non, le règne de la donnée. Les technologies de l’information ont fait exploser les données et les données sont le terreau sur lequel prospèrent les technologies de l’information (et ceux qui savent les manipuler).

La notion de document a été largement évacuée du discours des médias. Pas complètement car le discours juridique résiste (on l’en remercie) et les habitudes aussi (les utilisateurs continuent d’appeler volontiers un courrier ou un rapport un « document »). Mais les données occupent quand même le devant de la scène et on n’y pourra rien changer. Inversement, les technologies ne pourront pas effacer ce fait que certaines activités humaines, même quand elles sont sous-traitées à un outil (la machine pense pour vous…), génèrent des droits et des obligations, laissent des traces susceptibles d’apporter dans un temps ultérieur la preuve que ceci ou cela a été fait ou dit, avec certaines conséquences pour les auteurs de ces traces.

De sorte que les technologies n’ont rien changé aux exigences d’archivage, c’est-à-dire aux exigences de mise en sécurité des traces des engagements, des décisions, des faits observés. Qu’on les appelle données ou documents, on s’en moque. Enfin, pas tout à fait.

Car ce qui caractérise un (bon) document est qu’il regroupe l’ensemble des éléments d’information propres à donner une connaissance d’un fait : le cœur de l’énoncé par l’auteur, le contexte, la validation et la date du document (sans date, pas de preuve). Et pourtant, les « documents » incomplets, non validés et/ou non datés sont légions. D’où l’exigence de la norme ISO°15489 sur le records management d’avoir des « records » authentiques, fiables, intègres et exploitables, caractéristiques auxquelles InterPares ajoute la précision (accuracy) et la complétude (completeness).

De même, on appelle données tout et n’importe quoi. Les données sont a priori tout ce qui est numérique, mais aussi le contenu des documents papier ; j’en veux pour preuve l’interprétation du RGPD (Règlement général pour la protection des données personnelles, en vigueur depuis mai 2018) qui vise également les courriers papier, les bulletins de salaire papier – que sais-je encore ? – même si le risque de divulgation est atténué par la lenteur de l’utilisation comparée au numérique.

Dire qu’avant on archivait des documents et qu’aujourd’hui on archive des données ne veut rien dire. La question n’est pas le support de l’information ! La question est la valeur de l’objet que l’on gère, son intérêt pour la connaissance, le risque qu’il porte en termes de preuve.

Les traces engageantes de l’activité revêtent toutes sortes de formes. C’est au professionnel de l’archivage de les détecter et de les gérer pour ce qu’elles sont. S’il est souhaitable de conseiller aux décideurs un peu légers dans leurs comportements de produire des traces solides et pérennes lorsqu’elles doivent couvrir un risque dans la durée, il est tout à fait stupide de vouloir aller à l’encontre de l’histoire des technologies et des relations humaines, en s’accrochant au papier ou à ce qui lui ressemble, au nom d’un principe de continuité mal comprise.

Au 21^e siècle, qu’on archive des documents ou des données, ce qui perdure dans l’exigence d’archivage est de délimiter des objets documentaires qui ont du sens, c’est-à-dire qui sont contextualisés et qui sont datés. Sans cela, on stocke, on entasse, on dépense des budgets à occuper des serveurs en surchauffe pour pas grand-chose.

Délimiter un objet documentaire ne veut pas dire constituer un objet physique unique ou un fichier numérique unique que l’on stocke là dans un coin avec ordre de ne plus bouger. Il s’agit de lier entre elles certaines données qui « documentent » le fait ou l’idée que l’on veut ou que l’on doit tracer, donc le plus souvent un ensemble de fichiers, quels que soient leur nombre et leur lieu de stockage, dont on veut pouvoir gérer l’interdépendance comme réponse à une question potentielle, par exemple : comment a été prise telle décision ? C’est aussi le moyen de gérer sûrement le cycle de vie, c’est-à-dire piloter le fait qu’un jeu de données constitutif de plusieurs objets documentaires distincts sera conservé pendant la durée de conservation la plus longue parmi celles des objets dont il relève. C’est la même idée qu’on trouvait déjà dans la norme européenne sur l’archivage électronique MoReq il y a une quinzaine d’années, norme qui soulignait qu’avec le numérique la notion de dossier disparaissait au profit d’une « métadonnée de dossier », identifiant commun d’un certain nombre de fichiers permettant de définir la valeur d’un objet supérieur à la somme de la valeur de chacune des pièces prise isolément.

Codifier les valeurs plutôt que classer les contenus

Le dernier volet de cette philosophie concerne la recherche de l’information.

Parmi les nombreux avantages des technologies numériques se trouve la capacité de retrouver de plus en plus vite dans une masse de données de plus en plus grande tel mot, telle phrase, telle combinaison de critères. Toute personne qui a l’expérience d’avoir produit un livre sans ordinateur ou d’avoir fréquenté les bibliothèques avant l’arrivée de l’informatique sait ce que coûte la fabrication manuelle d’un index ou l’absence d’index pour exploiter un ouvrage. Et sait, par conséquent, l’apport de la technologie sur ce plan.

Or la puissance des outils numériques périme largement les plans de classement traditionnels lesquels étaient conçus pour faciliter la recherche pour les utilisateurs. Et il faut s’en réjouir. C’est pourquoi je suis régulièrement frappée de constater la faveur dont jouissent encore les plans de classement chez les professionnels de l’information, chez les étudiants, chez les utilisateurs. On voit encore beaucoup de projets de GED ou d’archivage qui prévoient dans les premières étapes du projet la création d’un plan de classement, sans qu’on sache toujours très bien à quoi il doit servir, comme s’il suffisait de prononcer l’expression « plan de classement » pour se conformer à la norme, parce qu’on a toujours fait des plans de classement… Le plan de classement apparaît comme un idéal bien que, chez la plupart de ses adeptes, il coexiste avec une pratique quotidienne de Google ou d’autres moteurs Internet dont le système de recherche est basé sur des algorithmes qui n’ont pas grand-chose à voir avec les plans de classement.

Il y aurait beaucoup à dire sur la pratique des plans de classement, entre les classifications thématiques (les contenus) et les classifications de provenance (les services qui créent les fichiers), sur la profondeur de l’arborescence (jusqu’à sept ou huit niveaux de profondeur où l’on se noie avant d’avoir trouvé ce qu’on cherche), sur la pérennité des plans de classement (deux ou trois ans après la validation du plan, 50 % des documents sont classés hors du plan, dans un « divers » provisoire qui dure ou dans rien du tout). Mais la réputation des plans de classement ne semble pas souffrir de ces constats. Étrange.

Quand j’interroge les gens pour savoir s’ils ont un plan de classement dans leur messagerie électronique, je constate en général que la moitié a créé un plan de classement par transposition des pratiques documentaires traditionnelles, et que l’autre moitié n’a pas de plan de classement et n’éprouve pas le besoin d’en avoir car les fonctionnalités de l’outil de messagerie suffisent amplement à ses besoins de recherche de tel ou tel message.

En revanche, ce que les outils numériques ne savent pas faire, ou font très mal si l’intelligence humaine ne les aide pas, c’est de qualifier les données, d’apprécier leur qualité, de définir leur valeur, d’identifier celles qui sont importantes et celles qui sont toxiques, de distinguer celles qui sont engageantes de celles qui sont sans intérêt, de repérer les données utiles dans la durée versus les traces qui se périment au bout de quelques années,

Les technologies sont d’une grande aide pour retrouver une information. Et cependant, depuis vingt ans, elles n’ont guère fait progresser la gouvernance de l’information dans les entreprises. On peut voir dans les témoignages de ceux qui gèrent au quotidien la sécurité des données, la conformité au RGPD, les migrations et les destructions de données, etc. que le problème est toujours le même : des fichiers toujours plus nombreux, plus de 50 % des données dont on ne sait pas à quoi elles peuvent servir, des conservations douteuses, des recherches de preuve infructueuses, des fuites calamiteuses… bref des risques mal maîtrisés.

N’est-il donc pas évident que la priorité est de qualifier les données, de tagguer chaque fichier en fonction de sa valeur pour l’entreprise : utile ou non, à conserver sur le court terme ou pour une longue période, sensible ou peu critique, fréquemment consulté ou non. À partir de là – et seulement après cette première phase – il devient possible d’optimiser l’usage des technologies pour gouverner tous ces fichiers avec le meilleur rapport risque/coût/efficacité.

La méthode Arcateg™ propose une codification universelle des valeurs de l’information dans l’entreprise dans un référentiel de 100 catégories prédéfinies, qu’il n’y a plus qu’à personnaliser. Il s’agit d’un cadre de classement des valeurs, fermé et structuré, et non d’un plan de classement des contenus, ouvert et extensible.

Arcateg™ permet de tagguer l’information. Les systèmes d’information gèrent les fichiers selon cette valeur (sécurité, localisation, durée de conservation) et les moteurs de recherche retrouvent l’information.

Moralité: technologie rime avec méthodologie !

Pour en savoir plus: https://cf2id.fr/formation/construire-son-referentiel-arcateg-en-10-etapes/

6 commentaires

Ping : Signer au 21e siècle - Le blog de Marie-Anne Chabin
Thibaut Girard dit :

31 mai 2021 à 12:33

Je n’ai pas des responsabilités de chef de service comme Isabelle, mais je constate moi aussi que je produis très souvent sous forme électronique des écrits qui m’engagent, voire qui engagent mon employeur. Je n’imagine pourtant pas et même je ne crains pas particulièrement que les lecteurs de ces écrits doutent que j’en suis l’auteur ou s’interrogent sur leur intégrité. C’est dire combien le sujet de la signature mérite d’être traité de façon approfondie et avec quelle impatience j’attends ce futur billet.
- MAC dit :
  
  31 mai 2021 à 12:38
  
  Merci Thibaut, pour ta remarque et ton intérêt. Le billet annoncé est en cours et je vais y ajouter ton angle de vue mais, comme tu t’en doutes, il n’épuisera pas le sujet. À bientôt.
Isabelle Chiavassa dit :

26 mai 2021 à 16:35

A propos des informations engageantes, la valeur d’une signature devient de plus en plus floue. Dans mes trois derniers postes, je n’ai pas eu de délégation de signature officielle ; toutefois, je constate comme archiviste municipale que j’ai signé et signe néanmoins énormément, sous forme papier et sous forme électronique. Il est vrai que l’ouverture de droits dans un logiciel équivaut à une délégation de signature.
Ainsi, on m’a donné les droits pour évaluer des agents (logiciel d’évaluation dématérialisé), pour préparer des bons de commande et certifier le service fait dans le logiciel finances, pour verser des fichiers bureautiques dans l’application d’archivage ; sous forme papier, je signe les évaluations de stagiaire et autres formulaires courants, les dons d’archives privées, et implicitement, je suis habilitée de fait à contrôler les numérisations au retour des prestataires ; et surtout je signe les bordereaux de versement après réception, impliquant un transfert de responsabilité du service versant à mon service. Ma signature engage-t-elle la collectivité, je l’ignore, mais je n’ai pas de délégation de signature formelle.
- MAC dit :
  
  26 mai 2021 à 19:07
  
  Un grand merci pour ce témoignage, Isabelle. Je ne vous réponds pas ici car j’ai trop de choses à dire; je vais en guise de réponse, rédiger un nouveau billet sur le sujet que vous soulevez.
Ping : « Philosophie de l’information engageante » – Le blog-tuteur du NTD213

Commentaires fermés

Philosophie de l’information engageante

Des traces d’échange bien plus que des documents statiques

Des données, des données… Oui, mais liées, datées, contextualisées

Codifier les valeurs plutôt que classer les contenus

6 commentaires