Ce n’est pas parce que vous détenez des données que vous possédez des informations.
La donnée est brute, c’est un ensemble de signes que l’on peut rattacher à un système d’écriture mais qui n’est pas suffisant pour faire passer une information à un utilisateur. La donnée isolée ne parle pas. Ce n’est qu’un morceau d’énoncé, un bout de message qui doit être contextualisé, un indice qui doit être complété pour apprendre quelque chose au lecteur, de préférence la même chose que ce que l’auteur a voulu écrire ou enregistrer.
Les trois lettres OCA désigneront, selon le contexte métier et linguistique, un tubercule péruvien, l’Observatoire de la Côte d’Azur (dont le logo ci-dessus n’est pas forcément très lisible), une oie italienne (oca) ou une guêpe russe (oca en lettres cyrilliques aussi bien que latins- prononcez « assa »).
« 23 » sera, selon les cas, le poids en kilos d’un enfant lors de sa visite médicale, la note sur 40 d’un devoir très moyen, le numéro du département de la Creuse, la température en degrés Celsius dans le jardin (ou en degrés Fahrenheit, mais alors prenez une petite laine) ou encore, dans un document plus personnel, le nom codé de l’actuel archevêque de Paris…
Un groupe de mots organisés conformément aux règles de la syntaxe peut lui-même être inintelligible, ou du moins polysémique. La phrase « La souris bloque sur la bécane » évoque-t-elle une petite pépée qui refuse un tour en moto ? Ou l’accessoire informatique qui n’est pas reconnu par l’ordinateur ? Ou la bestiole de laboratoire qui panique dans sa roue métallique ? Évidemment, une image à la place de la phrase éviterait cette ambiguïté (sur la lisibilité et donc l’intelligibilité des photographies, voir le billet d’André Gunthert).
Donc, toute information écrite qui se respecte exige deux choses :
– que les données qui la composent soient liées à des listes de valeurs prédéfinies ; et
– que ces données soient agencées en référence à un contexte connu et accessible par l’utilisateur.
Le numérique perturbe les bonnes habitudes, notamment pour les données dites « structurées ». En effet, l’archivage des tables d’une base de données en même temps que les données elles-mêmes, comme élément contextuel, ne va pas toujours de soi, alors qu’il ne viendrait pas à l’esprit d’arracher les en-têtes de colonnes d’un registre pour l’archiver.
Ce billet fait partie d’un triplet : lisibilité – intelligibilité – exploitabilité (lundi prochain)
Un commentaire