Cette année, la Bibliothèque apostolique vaticane va fêter ses 540 ans. Il faut dire que les ouvrages les plus anciens que cette institution possède sont bien plus anciens que la bibliothèque elle-même ; nous y retrouvons par exemple des ouvrages datant de l’antiquité, des parchemins de l'époque carolingienne ou même des documents issus de l'empire chinois des Ming. Au total plus de 1,6 millions de livres antiques et médiévaux, 8 300 incunables, 180 000 manuscrits et etc.
Si l’accès à ce trésor n’était réservé qu’à une poignée de personnes qui se sont rendues dans les salles de la bibliothèque, les mécènes ont décidé il y a deux ans de fonder une organisation à but non lucratif, la Digita Vaticana Oculus, qui s'est fixé comme objectif de numériser au moins 82 000 ouvrages et 41 millions de pages dans un premier temps.
Le 20 mars 2014, le japonais NTT Data Corp a annoncé avoir obtenu le contrat, à hauteur de 18 millions d’euros qu’il a signé avec les mécènes réunis au sein de la Digita Vaticana Oculus, pour la numérisation des documents de la bibliothèque apostolique vaticane. Sept mois plus tard, les 500 premiers ouvrages accessibles en ligne sont rendus publics. Un catalogue en ligne a été mis en place pour faciliter la recherche et la consultation des documents. En clair, cette institution de l'état pontificale s’est elle aussi mise à l’heure du numérique. Le projet en tant que tel durera neuf ans qui consiste en l'indexation de quelque 41 millions de pages de la bibliothèque. Lorsque tout sera terminé, l'on estime que quelque 2,8 péta-octets de données auront été nécessaires.
Pour Luciano Ammenti, le responsable des technologies de l’information et de la communication de la Bibliothèque du Vatican, les formats de fichiers Open Source constitue le moyen le plus fiable pour l’humanité de préserver son histoire.
« La Bibliothèque du Vatican est vouée à la conservation de documents. Nous essayons de préserver notre histoire. Nous avons tenté en vain d'augmenter le nombre de salles de lecture disponibles pour les personnes qui veulent consulter notre bibliothèque, mais nous avons réalisé que ces lieux ne pourraient jamais être assez nombreux. Nous avons 82 000 manuscrits au total et seuls 20% d'entre eux peut être consultés simultanément » a-t-il exposé.
« Pour contourner ce problème, nous avons mis l'accent ces dernières années sur la conservation des manuscrits sous forme numérique. La question essentielle qui s'est posée dès le début du projet portait sur le choix du format d'enregistrement pour les textes. Nous devions nous assurer que le public pourrait encore lire les fichiers numériques d'ici 50 ans ou 100 ans » a-t-il déclaré. Les outils Open Source ont été choisi parce qu’ils ne nécessitent pas de recourir à une plateforme propriétaire. D’ailleurs, le DSI avance que « nous les sauvegardons en tant qu'image car ce type de format à une durée de vie plus longue qu'un fichier. Vous ne devez pas compter sur PowerPoint ou Word pour lire les documents et, dans 50 ans, les manuscrits pourront toujours être consultés ».
Habituellement, le format TIFF est préféré lors de l'archivage. Mais cela pose plusieurs problèmes : « ce format n'est pas Open Source et il n'est pas mis à jour sur une base régulière, la dernière fois c'était en 1998 » a argumenté Ammenti. « En plus de cela, c'est un format 32 bits qui n'est pas prêt pour l'imagerie 3D, ce qui limite le type et la quantité d'informations qu'il peut préserver ».
C'est la raison pour laquelle le Vatican recourt à FITS (Flexible Image Transport System) en tant que format d'image, un standard relativement méconnu, qui est surtout utilisé pour conserver les données scientifiques (notamment en astronomie). Ses avantages sont multiples, selon Ammenti. Par exemple, FITS tourne sur 64 bits, accepte une taille de fichier illimitée, supporte la visualisation 3D en plus d’être Open Source. « Ce qui facilite les choses, c'est que FITS contient quasiment toutes les données possibles d'un document. Certaines pièces intègrent de l'or, de l'argent ou d'autres matières délicates qu'il faut aussi pouvoir saisir lorsqu'on scanne un document ». Il faut dire qu’un fichier FITS peut contenir plusieurs extensions, et chacune de celles-ci peut contenir des données.
La numérisation ne va pas sans risque puisque, au fil du temps, il peut y avoir perte de qualité. « C'est pourquoi chaque fichier que nous créons, est contrôlé tous les six mois » a-t-il expliqué. Et, même si le format FITS est régulièrement actualisé, Ammenti n’y voit aucun inconvénient : « c’est comparable à Unix, qui existe depuis des décennies déjà, qui a évolué aujourd'hui et qui est disponible sous plusieurs formes, mais qui, intrinsèquement, fonctionne encore de la même manière ».
En définitive, il a conclu en disant que « nous voulions créer quelque chose et ce, non pas pour nous, mais pour les générations futures, quelque chose qui sera encore et toujours lisible et consultable dans cent ans par tout un chacun dans le monde ».
Un intérêt stratégique d’une opération qui suscite visiblement de l’intérêt en haut lieu puisqu’il confie que « bien qu'il soit préoccupé par des considérations de plus grande importance, le Pape François se tient au courant des avancées de notre projet et j'ai régulièrement des entretiens avec Sa Sainteté à ce sujet ».
Accéder au catalogue en ligne du Vatican
Source : V3
Et vous ?
Qu'en pensez-vous ?
Le Vatican opte pour l'Open Source dans la numérisation de sa bibliothèque
Le format FITS a retenu son attention
Le Vatican opte pour l'Open Source dans la numérisation de sa bibliothèque
Le format FITS a retenu son attention
Le , par Stéphane le calme
Une erreur dans cette actualité ? Signalez-nous-la !