Tous les billets avec l'étiquette traitement de texte

Images extraites des Archives du duché de Caderousse XIe-XIXe siècles par Martine Sainte-Marie avec la collaboration de Sophie Izac-Imbert sous la direction de Christine Martella, directeur des Archives départementales de Vaucluse

Imprimer des instruments de recherche normalisés

Introduction

Au tournant du 3e millénaire, lors de l’arrivée du format standard XML-EAD et donc la diffusion des instruments de recherche électroniques, on a pu annoncer la fin des instruments de recherche sur support papier. Nous devons convenir que nous partagions assez largement ce pronostic, peut-être en lointains et naïfs disciples d’Herbert Marshall McLuhan qui annonçait, en 1962, la fin de La Galaxie Gutenberg.

Plus de dix ans se sont maintenant écoulés depuis la diffusion du format EAD en France et force est de constater que la restitution des instruments de recherche sous forme imprimée a la vie dure. C’est indéniablement parce qu’elle répond à un besoin. Et ce besoin n’était pas satisfait, entrainant, comme nous l’a dit récemment un conservateur, une frustration exprimée par nombre de ses confrères.

Continuités et ruptures

De l’instrument de recherche manuscrit, puis dactylographié, puis réalisé avec un traitement de texte à l’instrument de recherche imprimé, on peut observer une continuité évidente : il s’agissait in fine d’offrir à ses publics un document décrivant des documents, accessible sans intermédiaire sur un support papier.

L’informatisation, au-delà du traitement de texte, a introduit des ruptures majeures. D’abord, dans les années 1980-1990 avec les bases de données documentaires. Ensuite, au début du 3e millénaire, avec les instruments de recherche électroniques. Les descriptions de documents seraient-elles désormais inaccessibles sans l’intermédiaire de matériels et logiciels informatiques ?

Lecture humaine et traitement par les machines

Un instrument de recherche, comme document, doit être lisible – sur support papier ou sur écran – par un utilisateur final. Avec l’arrivée de l’informatique, l’instrument de recherche doit également être traité par une machine afin, en particulier, de faciliter l’accès aux informations cherchées, par l’utilisation de moteurs de recherche.

On doit donc faire en sorte que l’instrument de recherche soit :

  • D’une part rendu lisible, compréhensible et agréable à consulter par l’être humain.
  • D’autre part, réalisé de telle manière que les traitements par les machines soient aussi efficaces que possible.

Ces deux objectifs ne sont pas contradictoires mais nécessitent des qualités différentes, complémentaires.

On a pu reprocher aux instruments de recherche réalisés avec des traitements de texte de privilégier la forme (la présentation, destinée à la lecture humaine) au détriment du contenu (en particulier sa structuration). À l’inverse, la production d’instruments de recherche électroniques a pu inciter à négliger un peu leur forme et donc leur lisibilité et, par voie de conséquence, l’envie de les consulter. De plus – mais nous aurons l’occasion d’y revenir – on a finalement eu tendance à privilégier un nouveau formalisme (destiné, lui, d’abord aux machines) : la syntaxe XML-EAD.

Une grande leçon de l’expérience, accumulée au cours d’un peu plus d’une décennie, est qu’on ne doit pas restituer les instruments de recherche sur un seul type de support et suivant un seul format, mais proposer plusieurs types de restitutions : pratiquer ce que l’on appelle, un peu savamment mais précisément, le multi-support et le polymorphisme. Ce polymorphisme répondant à des besoins de lectures et de traitements distincts.

Une demande de restitution sur support papier

Il ne s’agit pas, ici, de refaire l’histoire de l’imprimé et de la lecture, ni de rappeler les avantages de la forme codex.
Mais, simplement, de rappeler une demande exprimée et par les publics et par les archivistes. L’instrument de recherche papier peut être une simple sortie sur imprimante de bureau pour la salle de lecture des archives ou une édition exceptionnelle destinée à mettre en valeur un fonds remarquable, à valoriser l’image du service d’archives et de la collectivité à laquelle il est rattaché. Il peut également être un simple outil pour la relecture et l’amélioration de l’instrument de recherche en cours de réalisation.

Une demande qui peut être satisfaite

Les restitutions d’instruments de recherche à partir d’Arkhéïa Aide au classement ne sont pas limitées à un format : le polymorphisme et le multi-support sont conformes à l’essence d’Arkhéïa. On peut rappeler, en effet, qu’avant l’arrivée du format EAD et des outils de mise en ligne spécifiques aux archives, Arkhéïa générait de multiples formats adaptés aux logiciels documentaires alors utilisés pour la recherche, des fichiers HTML et XML (avant l’arrivée de l’EAD).
Le fait que les descriptions soient stockées comme des données, dans un système de gestion de base de données et non comme un document dans une syntaxe particulière présente un avantage considérable pour les restitutions multiples.

Des objectifs à atteindre

La feuille de route était, en gros, la suivante :

  • Partir des données déjà saisies (en respectant la norme ISAD(G) et les règles fixées par la DTD EAD) dans le module Arkhéïa Aide au classement.
  • Pouvoir, si nécessaire, ajouter des informations complémentaires (comme préface, annexes…) présentes dans les instruments de recherche imprimés mais pas dans les instruments de recherche électroniques.
  • Générer, de la manière la plus automatisée possible, un fichier dans un format facilement imprimable sur une imprimante de bureau ou en passant par les services d’un imprimeur.
  • Que la mise en page soit produite automatiquement, dans le respect de la structure de l’instrument de recherche et en prenant en compte la totalité des éléments de description utilisés, ainsi que les éventuelles illustrations intégrées.
  • Que la mise en page obtenue, malgré sa complexité potentielle, soit claire et lisible, attractive et moderne, ce qui n’est pas facile a priori.
  • Qu’il reste possible, aux archivistes, d’effectuer des retouches de détail (comme pour des coupures malheureuses en fin et début de page)

Une première réalisation et un travail en partenariat

Les archives départementales de Vaucluse ayant programmé l’impression d’un instrument de recherche sur un fonds privé – le duché de Caderousse –, sa directrice, Christine Martella, a accepté de prendre le risque que l’instrument de recherche imprimable soit généré directement à partir d’Arkhéïa plutôt que d’en confier la mise en page à un imprimeur. Cette option a certainement impliqué plus de travail pour le service, des délais plus longs. L’avantage était de disposer ensuite d’une solution réutilisable pour de prochains instruments de recherche imprimés, mais aussi pour leur restitution sur de simples imprimantes du service… et réutilisable pour d’autres services.
Martine Sainte-Marie, auteure de l’instrument de recherche, et Sophie Izac-Imbert ont très activement participé au contenu, à son découpage, aux choix de mise en page, à l’illustration.

L’agence Glanum a fourni un important travail pour l’ergonomie et la création graphique et pour piloter la génération du code de restitution des différentes parties de l’instrument de recherche.

Anaphore a intégré au module Arkhéïa Aide au classement la génération du code correspondant et prévu les paramétrages permettant la généricisation du processus pour qu’il soit facilement utilisable pour d’autres instruments de recherche.

Le choix d’un format de restitution

Le choix d’un format n’allait pas de soi. Le but étant de produire de la manière la plus automatisée possible un document imprimable de très grande qualité, plusieurs options se présentaient, chacune avec avantages et inconvénients.
Les hésitations ont porté sur

  • Le format PDF, relativement facile à générer, largement répandu, utilisé par les imprimeurs, mais présentant l’inconvénient de ne pas être facilement retouchable.
  • Un format lié à un logiciel de PAO, idéal pour la mise en page, utilisé, bien sûr par les imprimeurs, mais nécessitant des compétences présentes seulement dans certains services d’archives.
  • Un format lié à un logiciel de traitement de texte, maitrisé par une grande majorité d’archivistes, facile à retoucher. On pouvait hésiter entre un logiciel open source, comme Open Office, mais qui présente le handicap majeur de ne pas gérer les gros documents et qui, de plus, connait des vicissitudes depuis le rachat de Sun par Oracle.

Le choix final s’est finalement porté très prosaïquement sur MS Word, que chacun ou presque maitrise et qui supporte de très gros documents (nous avons pu tester sur des instruments de recherche de plus de 2.000 pages).

L’instrument de recherche comme un kit assemblable

Outre le corps, présent aussi bien pour les instruments de recherche « classiques » qu’électroniques, l’instrument de recherche imprimé peut présenter des parties additionnelles comme préface, introduction, annexes, index, glossaires, bibliographies, tables de concordance, des illustrations et des matières…
Arkhéïa propose des formulaires pour la saisie des parties « non-EAD » et de les restituer à la demande.
Un pied de page, avec fil d’Ariane et pagination, un calcul automatique de la table des illustrations (à partir des légendes des images) et de la table des matières avec renvois aux pages sont également générés.

La gestion des illustrations

Un instrument de recherche bien présenté peut être attractif. Il le sera d’autant plus s’il est illustré. La gestion des illustrations est donc une partie importante (et délicate) dans la réalisation de l’instrument de recherche.
L’objectif, ici encore, était d’automatiser le plus largement possible la production et la mise en page de l’instrument de recherche.
Les dimensions des images sont recalculées automatiquement en fonction des dimensions originelles et de la largeur disponible (selon le niveau de description).
Une interface de gestion des images a été ajoutée, permettant, entre autres, de scruter des dossiers pour relever les noms et dimensions des images qu’il contient.

Un outil paramétrable pour tout type d’instruments de recherche

L’objectif initial était de permettre des impressions de grande qualité pour des instruments de recherche « classiques ». Cet objectif semble largement atteint à l’écoute des réactions des archivistes qui ont pu examiner les résultats.
Mais, de plus, le souhait a été exprimé d’utiliser les mêmes possibilités pour des bordereaux de versement. Anaphore y a travaillé également.
Afin de permettre des utilisations souples et variées de la génération d’instruments de recherche imprimables, de nombreuses options d’utilisation sont intégrées ou prévues grâce à des paramétrages.

Les étapes suivantes, en fonction des demandes et réactions des différents utilisateurs, consisteront à permettre un encore plus grand nombre de restitutions variées grâce à des paramètres supplémentaires, toujours simples à mettre en œuvre.

Plusieurs formes de disponibilités

L’instrument de recherche au format traitement de texte peut être conservé comme tel et converti au format PDF. Les utilisations possibles en sont nombreuses, certaines ont déjà été évoquées, nous en donnons une petite liste ici :

  • Aide à la relecture, facilitée par une présentation claire, lisible, agréable.
  • Restitution directe sur les imprimantes du service, sans ou avec couleurs, pour la mise en disposition en salle de lecture.
  • Édition par l’intermédiaire d’un imprimeur auquel on fournit un fichier PDF de haute qualité.
  • Mise à disposition, si le service le désire, d’une version PDF téléchargeable par les internautes, leur permettant de disposer d’une version complète de grande qualité.