Tous les billets avec l'étiquette informatisation

Arènes loties d'Arles par J.B. Guibert - 18e siècle via Wikimedia Commons

Les travaux récents d’Anaphore

Les textes précédemment publiés sur ce blog rendaient principalement compte d’une partie du travail de veille d’Anaphore.
Mais, l’activité d’Anaphore ne se limite pas à la veille. Des chantiers, nombreux et importants, sont conduits, les uns déjà terminés, d’autres en cours. Ces chantiers ne sont pas, bien entendu, sans rapport avec ce travail de veille et les liens entre les différentes composantes de notre activité devraient progressivement apparaitre clairement.
Ce blog doit aussi rendre compte de nos travaux. Ce premier texte va en faire une présentation globale et partielle. Par la suite, nous aurons l’occasion de présenter plus en détail ces différents chantiers.

Des évolutions nécessaires

Arkhéïa et Anaphore sont au service des archivistes et des archives depuis plus de deux décennies. Le temps d’accumuler des expériences et de voir des contextes évoluer. Contexte technique, contexte administratif, contexte concurrentiel… qu’il faut prendre en compte. Mais, Anaphore n’entend pas se contenter de s’adapter à ces changements, elle tient également à anticiper des évolutions encore plus fondamentales dont vont bénéficier les métiers d’accès à l’information. Et c’est à cet égard, en particulier, que le travail de veille est essentiel.

Des évolutions dans plusieurs directions

Nous travaillons sur l’interface et l’ergonomie d’Arkhéïa, en particulier le module Thésaurus et les modules de gestion.
De nombreux travaux sont en cours concernant les descriptions de documents d’archives. Anaphore a consacré de nombreuses années à offrir la possibilité de saisir tous types d’instruments de recherche sur tous types de documents, sans pour autant négliger les possibilités de restitution de ces instruments de recherche. Les travaux plus récents portent particulièrement sur ces possibilités de restitution.

L’interface d’Arkhéïa

Anaphore a fait appel à une agence spécialisée dans le graphisme et l’ergonomie (La Souris verte) afin de mettre au point une nouvelle interface pour Arkhéïa. Il s’agissait de disposer d’une présentation plus agréable, plus moderne, mais aussi plus ergonomique, plus intuitive.
L’agence a proposé une architecture plus fonctionnelle des fenêtres, des menus et boutons ; des icônes ont été spécifiquement dessinées.
C’est donc un travail de refonte qui a été entrepris, un chantier de longue haleine. Actuellement, les petits modules Accueil, Paramétrage et Acteurs sont fonctionnels. Le module Récolement est en phase d’achèvement et le module Thésaurus est bien avancé.
Le module Récolement déconnecté, qui a été utilisé et très apprécié par les archives départementales du Gard à l’occasion de leur déménagement, a également été refondu depuis.

Ci-dessous, un exemple de la nouvelle interface avec le module Thésaurus.
InterfaceThesaurus

La restitution des instruments de recherche

Les instruments de recherche sont parmi les productions à plus grande valeur ajoutée des archivistes qui leur consacrent beaucoup de leurs compétences, de leur temps et de leur énergie. Il est essentiel que les résultats soient lisibles, compréhensibles et, autant que possible, agréables !
Anaphore attache une grande importance à la qualité des instruments de recherche. Il ne faut pas, ce qui est malheureusement souvent le cas, qu’informatisation rime avec appauvrissement. Car la mise en ligne d’instruments de recherche électroniques présente souvent des limites : la navigation peut être laborieuse, on a difficilement une vue et une compréhension globales du fonds… ; et, pour autant, les performances et l’ergonomie des recherches ne sont pas optimisées.

A.  Des possibilités d’impression de grande qualité

Nous avons déjà présenté ici les possibilités de génération de fichiers directement imprimables. Disponible depuis la fin de l’année 2013, cette fonction a été largement adoptée, et parfois avec un certain enthousiasme.

B.  Une nouvelle page HTML

Tous les instruments de recherche ne peuvent pas être imprimés, ni même ne méritent de l’être. Internet est indubitablement aujourd’hui un moyen de diffusion privilégié.
Notre objectif était donc de permettre la consultation en ligne de véritables instruments de recherche. En 2011, Anaphore avait déjà produit un export HTML de qualité avec l’aide d’une agence web (Glanum). En 2014, un nouveau chantier a été lancé pour une nouvelle présentation des instruments de recherche. La feuille de route étant, en particulier, la suivante :

  • Permettre l’affichage à l’écran de l’ensemble d’un instrument de recherche (et pas seulement d’une petite partie à la fois) afin de pouvoir le faire défiler.
  • Obtenir une présentation lisible, agréable, adaptée à l’écran et moderne.
  • Réduire considérablement le poids de la page, malgré les contraintes ci-dessus afin d’offrir des temps de chargement courts.
  • Adapter automatiquement l’affichage à tout type d’appareil, dont les tablettes et même les smartphones (on dit web adaptatif ou responsive web design).
  • Optimiser le référencement des informations contenues dans les instruments de recherche.

ExportHTML

La recherche dans les instruments de recherche

Nous avons eu l’occasion de présenter, dans ce blog, les principales caractéristiques des moteurs de recherche de troisième génération conçus pour les bibliothèques. Ces caractéristiques sont également très intéressantes pour les instruments de recherche archivistiques. Toutefois, leur adaptation ne va pas de soi et nécessite une très bonne connaissance des problématiques, une réflexion approfondie et une stratégie fine, compte tenu de la grande complexité de cette question (description et indexation à niveaux avec gestion de l’héritage, variabilité des métadonnées descriptives versus la régularité pour les bibliothèques…).
Anaphore n’avait pas pris directement en charge le développement de logiciels de recherche et de navigation, mais est à l’origine des premières réalisations pour les archives (ActionArchives et Pleade).
Le moteur Bach, aujourd’hui opérationnel, bénéficie de toutes ces réflexions et expériences, ainsi que de longs mois de développements. Il offre des fonctionnalités et une ergonomie totalement inédites pour l’interrogation de nos instruments de recherche archivistiques.
Bach

Vers le web sémantique

D’une part, le mouvement vers les données liées est inexorablement en marche. Les grandes bibliothèques s’y sont résolument engagées, comme la Bibliothèque nationale de France (BNF). C’est aussi le cas, en France, de l’Agence bibliographique de l’enseignement supérieur (ABES).
Pour les archives, l’intérêt du web des données est largement aussi vif que dans le cas des bibliothèques (voir, par exemple la présentation d’Anila Angjeli au congrès annuel 2012 de la SAA).

D’autre part, après les bibliothécaires (avec les modèles FRBR, FRAD…) et bien d’autres, les archivistes sont conscients de l’impérieuse nécessité d’un modèle global. Voir, par exemple, les travaux du Conseil international des archives sur la révision des normes de description et l’élaboration d’un modèle conceptuel pour les archives.
En effet, pour diverses raisons historiques (qu’il n’est pas question de remettre en cause), les choses ont été un peu faites à l’envers en commençant par rédiger des normes, par établir des formats standard et par produire des outils informatiques, sans avoir une vision globale des entités concernées par nos descriptions et sans avoir explicité les relations qu’elles entretiennent entre elles.
Pour Anaphore, il ne serait pas raisonnable, aujourd’hui, d’envisager l’avenir et de faire évoluer les logiciels de description sans cette vue globale.
Anaphore s’est beaucoup documentée sur ces questions, a étudié plusieurs modèles ou ontologies (Europeana Date Model, Locah-Liking Lives, Salda, Finnish Conceptual Model for Archival Description, l’ontologie de l’APUG à Rome…) et suit de près les travaux sur l’évolution des formats (schémas EAC, EAD 3, Nomina…) et ceux du Conseil international des archives.
Néanmoins, pour ses besoins internes et afin de faire évoluer ses outils d’une manière cohérente et tournée vers l’avenir, Anaphore a travaillé, en collaboration avec Sparna à l’élaboration d’un modèle conceptuel pour décrire les fonds d’archives. Notons qu’Anaphore a pris le parti de nommer les classes et propriétés en français.
Ontologie2

Nous vous donnons rendez-vous sur notre blog où nous développerons les points abordés ci-dessus. À bientôt.

Numérisation et informatisation (Part II)
Entre codification des contenus et informatisation des processus

Notre billet précédent présentait, en introduction, « raison graphique » et « raison computationnelle ». Il s’agissait, dans cette première expression, de fixer un cadre discursif pour les questions et hypothèses qui vont suivre.

Revenons tout d’abord sur le titre « Numérisation et informatisation » proposé pour ces billets et sur lequel nous ne nous sommes que peu attardés jusqu’à maintenant. De quoi s’agit-il ici ? En effet, lorsque, dans notre métier, nous parlons de numérisation, nous nous référons le plus souvent soit aux campagnes de transformation de documents papiers en images numériques, soit à la transformation d’instruments de recherche en objet numérique en vue de leur encodage dans un format normalisé.

Numérisation

Nous aimerions ici revenir sur l’essence même du terme numérisation et des implications qu’il induit. Lorsque que l’on numérise, on réduit un objet réel en un ensemble de nombres pour le rendre manipulable par une machine informatique. En d’autres termes, numériser consiste à construire une représentation discrète (ou discrétisation) d’un objet rendu manipulable (ou manipulation). De ce fait, comme l’explique Bachimont, le numérique possède deux propriétés essentielles : « la manipulation machinale », dans le sens où tout contenu codé ou discrétisé devient manipulable par une machine ou un programme ; « l’arbitraire sémantique, puisque la discrétisation aboutit à un code indépendant du sens et de la nature du contenu numérisé. » Le numérique étant, en conséquence, le résultat d’un processus à la fois « calculatoire et arbitraire par rapport à l’interprétation et à l’exploitation » du contenu ainsi représenté. À plus forte raison, il implique la nécessité d’une posture intellectuelle particulière parce qu’il transforme notre rapport aux contenus mais aussi notre manière de les élaborer et de les exploiter. [1]

Le numérique, dans le contexte de nos échanges au quotidien, et le numérique, comme intermédiation pour l’accès aux contenus culturels et intellectuels, relève de plusieurs logiques proposées par les termes « informatisation » et « numérisation ». L’informatisation s’inscrit dans une démarche de modélisation à des fins opérationnelles, cette démarche porte sur les processus. La numérisation, comme nous venons de le voir concerne la codification des contenus.

Informatisation

Informatiser un service d’archives (ceci étant valable pour n’importe quel domaine) suppose « une étude préalable des processus à prendre en compte, la conception de solutions pour mimer les étapes de ces processus et, autant que possible, les optimiser, puis la réalisation d’une solution logicielle pour répondre à ces besoins. Dans le cas des archives, les processus sont nombreux, les pratiques très variées suivant les types de services et donc les besoins à prendre en compte également. »[2]

Dans le cadre de l’informatisation des services d’archives, plusieurs volets sont donc à prendre en compte :

  • un premier vise à permettre le suivi de la gestion matérielle des documents, c’est-à-dire, le suivi du déplacement des documents de l’entrée au service des archives à leur communication éventuelle en salle de lecture. Cette démarche relève de ce que l’on nomme communément l’informatique de gestion.
  • un second consiste à « identifier et expliquer le contexte et le contenu des documents d’archives en vue de faciliter leur accès »[3]. Il s’agit ici du traitement intellectuel des contenus. Démarche moins souvent explicitée, qui relève de l’informatique documentaire.

Dans le contexte de l’accès aux contenus archivistiques, on pourrait effectivement parler d’un troisième volet découlant du deuxième, celui de la mise en ligne, c’est-à-dire de la conception des outils de médiation et d’accès aux contenus pour les professionnels et les publics.

En amont de ces volets on trouve la collecte qui, quant à elle, relève autant de l’informatique de gestion que de l’informatique documentaire puisqu’il s’agit à la fois de suivre le parcours matériel des documents mais aussi d’en consigner le contenu afin d’en planifier le traitement dans le temps. L’informatisation procède donc bien d’une « démarche théorique où l’on pense un processus pour ensuite le construire, la numérisation d’une démarche pratique où l’on réalise un objet technique pour ensuite comprendre ses possibilités. »[4]

La démarche de l’informatisation continue de s’imposer pour ce qui concerne la gestion matérielle des documents, en d’autres termes la modélisation du processus métier.

On pourrait se risquer à dire que, jusqu’à l’émergence, voire la prise en considération réelle par les archivistes des normes puis des formats standard de la description archivistique, l’informatisation de la description des contenus, c’est-à-dire, de la production des métadonnées descriptives, s’est bornée à reproduire avec l’informatique ce que faisait l’archiviste manuellement pour classer et rédiger ses instruments de recherche. D’abord par la production manuscrite, puis avec le dactylogramme pour les faire imprimer et ensuite par l’usage du traitement texte. L’inventaire ainsi produit était pensé pour et par lui-même, de l’introduction à l’élaboration du sommaire et de l’index.

L’avènement des normes, l’évolution des formats et le mouvement vers une convergence numérique, tant pour la production des contenus que pour leur consultation par les publics, a produit, petit à petit, un basculement de la pratique vers une toute autre démarche, celle que nous supposons produite par ce que Bruno Bachimont a nommé la raison computationnelle.

Raison graphique, raison computationnelle

Pour rappel, la raison graphique repose sur le principe que la parole a été inscrite sur un support matériel entraînant l’introduction des deux éléments fondamentaux que sont la permanence et la spatialité. Éléments essentiels à une construction rationnelle nouvelle, c’est-à-dire à l’émergence d’une structure de signification donnant à voir et à comprendre une rationalité inexprimable par la seule parole (tableau à deux dimensions).

Ainsi, « toute structure rationnelle devant reposer en son principe sur un support matériel, permanent et spatial », la raison computationnelle, pour sa part, nous confronte à un nouveau type de support, un support dynamique dont la synthèse est calculée.

En fixant un rapport dans le temps, le calcul donne comme virtuellement présent ce qui ne l’est pas encore, ce qui le sera au terme du calcul. Le calcul est par conséquent un nouveau mode d’être ensemble… [5]

En conséquence, l’informatique en tant que nouveau « mode d’être ensemble » fait émerger de nouvelles structures conceptuelles. Sans en connaître encore toutes les ramifications – nous ne sommes en effet qu’au début de ce nouveau rapport –  il est néanmoins possible de tirer quelques observations pour ce qui est du propos qui nous intéresse, à savoir la production d’instruments de recherche normalisés.

En effet, partant du postulat proposé par Bruno Bachimont, on pourrait interroger l’hypothèse d’une modification de nos modes de pensée en termes de production et de mise en œuvre de nos instruments de recherche dans le nouveau contexte de médiation que constitue le numérique.

De l’instrument de recherche isolé au corpus d’instruments de recherche

Le tableau ci-après propose quelques éléments intéressant ce nouveau contexte de production.

Un processus de production nécessaire

Notre propos ici est d’émettre l’hypothèse que, peut-être, la prise en compte, dans le processus de production, des divers éléments proposés dans ce tableau, a pu affecter et donc faire évoluer notre rapport à la production. La prise en compte de la notion de corpus, nous « forçant » à penser au-delà du seul instrument de recherche produit isolément pour et par lui-même mais plutôt en relation avec l’ensemble des autres existants ou à venir pour donner corps à ce que l’on pourrait appeler « une unité électronique objectivable », c’est-à-dire un ensemble numérique qui ferait sens comme structure informationnelle rendue réelle et effective par la virtualisation.

L’idée étant de souligner ici que c’est le processus lui-même qui engendre la modification de notre rapport au processus-même de production. C’est parce que l’on serait confronté au « faire » que notre rapport au processus de production serait modifié et, en conséquence, à même d’évoluer dans une nouvelle rationalité dynamique et calculée parce que laissant émerger des rapports jusque là insoupçonnés.

Ainsi, on a pu voir émerger la nécessité de définir des procédures de production avec pour objectif principal la tentative de concevoir ce fameux corpus ou structure informationnelle réelle et effective qui ferait sens, c’est-à-dire, interrogeable de façon transversale, navigable et cohérent pour tout un chacun. Nous pourrions nous référer ici à l’idée d’une « intentionnalité éditoriale » issue de la raison computationnelle.

Car le « faire sens » de cette nouvelle rationalité virtuelle semble se construire à la fois par l’harmonisation des processus de production qui affectent tant la forme que le fond (c’est-à-dire les modes des descriptions, le nommage, etc.), par la définition des clés d’accès au contenu, définition qui par ailleurs doit pouvoir évoluer dans le temps pour maintenir « l’intelligibilité culturelle » et par la définition technologique pour prévenir tout « fossé d’obsolescence », c’est-à-dire, l’incapacité de maintenir la lisibilité technique du corpus dans le temps [6].

Dans un troisième et dernier billet nous poursuivrons notre réflexion sur la production des instruments de recherche et son évolution dans le contexte du changement de paradigme induit par la raison computationnelle.


  1. Bruno Bachimont, Ingénierie des connaissances et des contenus : le numérique entre ontologies et documents. Paris, Lavoisier, 2007, pp. 23-24.
  2. Louis Colombani, texte non publié.
  3. Norme internationale de la description archivistique ISAD(G).
  4. B. Bachimont, Ingénierie des connaissances et des contenus : le numérique entre ontologies et documents. p. 25.
  5. B. Bachimont, « Intelligence artificielle et écriture dynamique : de la raison graphique à la raison computationnelle », 1996, pp. 12-18.
  6. Nous reviendrons sur ces notions dans un autre billet.
Images extraites des Archives du duché de Caderousse XIe-XIXe siècles par Martine Sainte-Marie avec la collaboration de Sophie Izac-Imbert sous la direction de Christine Martella, directeur des Archives départementales de Vaucluse

Imprimer des instruments de recherche normalisés

Introduction

Au tournant du 3e millénaire, lors de l’arrivée du format standard XML-EAD et donc la diffusion des instruments de recherche électroniques, on a pu annoncer la fin des instruments de recherche sur support papier. Nous devons convenir que nous partagions assez largement ce pronostic, peut-être en lointains et naïfs disciples d’Herbert Marshall McLuhan qui annonçait, en 1962, la fin de La Galaxie Gutenberg.

Plus de dix ans se sont maintenant écoulés depuis la diffusion du format EAD en France et force est de constater que la restitution des instruments de recherche sous forme imprimée a la vie dure. C’est indéniablement parce qu’elle répond à un besoin. Et ce besoin n’était pas satisfait, entrainant, comme nous l’a dit récemment un conservateur, une frustration exprimée par nombre de ses confrères.

Continuités et ruptures

De l’instrument de recherche manuscrit, puis dactylographié, puis réalisé avec un traitement de texte à l’instrument de recherche imprimé, on peut observer une continuité évidente : il s’agissait in fine d’offrir à ses publics un document décrivant des documents, accessible sans intermédiaire sur un support papier.

L’informatisation, au-delà du traitement de texte, a introduit des ruptures majeures. D’abord, dans les années 1980-1990 avec les bases de données documentaires. Ensuite, au début du 3e millénaire, avec les instruments de recherche électroniques. Les descriptions de documents seraient-elles désormais inaccessibles sans l’intermédiaire de matériels et logiciels informatiques ?

Lecture humaine et traitement par les machines

Un instrument de recherche, comme document, doit être lisible – sur support papier ou sur écran – par un utilisateur final. Avec l’arrivée de l’informatique, l’instrument de recherche doit également être traité par une machine afin, en particulier, de faciliter l’accès aux informations cherchées, par l’utilisation de moteurs de recherche.

On doit donc faire en sorte que l’instrument de recherche soit :

  • D’une part rendu lisible, compréhensible et agréable à consulter par l’être humain.
  • D’autre part, réalisé de telle manière que les traitements par les machines soient aussi efficaces que possible.

Ces deux objectifs ne sont pas contradictoires mais nécessitent des qualités différentes, complémentaires.

On a pu reprocher aux instruments de recherche réalisés avec des traitements de texte de privilégier la forme (la présentation, destinée à la lecture humaine) au détriment du contenu (en particulier sa structuration). À l’inverse, la production d’instruments de recherche électroniques a pu inciter à négliger un peu leur forme et donc leur lisibilité et, par voie de conséquence, l’envie de les consulter. De plus – mais nous aurons l’occasion d’y revenir – on a finalement eu tendance à privilégier un nouveau formalisme (destiné, lui, d’abord aux machines) : la syntaxe XML-EAD.

Une grande leçon de l’expérience, accumulée au cours d’un peu plus d’une décennie, est qu’on ne doit pas restituer les instruments de recherche sur un seul type de support et suivant un seul format, mais proposer plusieurs types de restitutions : pratiquer ce que l’on appelle, un peu savamment mais précisément, le multi-support et le polymorphisme. Ce polymorphisme répondant à des besoins de lectures et de traitements distincts.

Une demande de restitution sur support papier

Il ne s’agit pas, ici, de refaire l’histoire de l’imprimé et de la lecture, ni de rappeler les avantages de la forme codex.
Mais, simplement, de rappeler une demande exprimée et par les publics et par les archivistes. L’instrument de recherche papier peut être une simple sortie sur imprimante de bureau pour la salle de lecture des archives ou une édition exceptionnelle destinée à mettre en valeur un fonds remarquable, à valoriser l’image du service d’archives et de la collectivité à laquelle il est rattaché. Il peut également être un simple outil pour la relecture et l’amélioration de l’instrument de recherche en cours de réalisation.

Une demande qui peut être satisfaite

Les restitutions d’instruments de recherche à partir d’Arkhéïa Aide au classement ne sont pas limitées à un format : le polymorphisme et le multi-support sont conformes à l’essence d’Arkhéïa. On peut rappeler, en effet, qu’avant l’arrivée du format EAD et des outils de mise en ligne spécifiques aux archives, Arkhéïa générait de multiples formats adaptés aux logiciels documentaires alors utilisés pour la recherche, des fichiers HTML et XML (avant l’arrivée de l’EAD).
Le fait que les descriptions soient stockées comme des données, dans un système de gestion de base de données et non comme un document dans une syntaxe particulière présente un avantage considérable pour les restitutions multiples.

Des objectifs à atteindre

La feuille de route était, en gros, la suivante :

  • Partir des données déjà saisies (en respectant la norme ISAD(G) et les règles fixées par la DTD EAD) dans le module Arkhéïa Aide au classement.
  • Pouvoir, si nécessaire, ajouter des informations complémentaires (comme préface, annexes…) présentes dans les instruments de recherche imprimés mais pas dans les instruments de recherche électroniques.
  • Générer, de la manière la plus automatisée possible, un fichier dans un format facilement imprimable sur une imprimante de bureau ou en passant par les services d’un imprimeur.
  • Que la mise en page soit produite automatiquement, dans le respect de la structure de l’instrument de recherche et en prenant en compte la totalité des éléments de description utilisés, ainsi que les éventuelles illustrations intégrées.
  • Que la mise en page obtenue, malgré sa complexité potentielle, soit claire et lisible, attractive et moderne, ce qui n’est pas facile a priori.
  • Qu’il reste possible, aux archivistes, d’effectuer des retouches de détail (comme pour des coupures malheureuses en fin et début de page)

Une première réalisation et un travail en partenariat

Les archives départementales de Vaucluse ayant programmé l’impression d’un instrument de recherche sur un fonds privé – le duché de Caderousse –, sa directrice, Christine Martella, a accepté de prendre le risque que l’instrument de recherche imprimable soit généré directement à partir d’Arkhéïa plutôt que d’en confier la mise en page à un imprimeur. Cette option a certainement impliqué plus de travail pour le service, des délais plus longs. L’avantage était de disposer ensuite d’une solution réutilisable pour de prochains instruments de recherche imprimés, mais aussi pour leur restitution sur de simples imprimantes du service… et réutilisable pour d’autres services.
Martine Sainte-Marie, auteure de l’instrument de recherche, et Sophie Izac-Imbert ont très activement participé au contenu, à son découpage, aux choix de mise en page, à l’illustration.

L’agence Glanum a fourni un important travail pour l’ergonomie et la création graphique et pour piloter la génération du code de restitution des différentes parties de l’instrument de recherche.

Anaphore a intégré au module Arkhéïa Aide au classement la génération du code correspondant et prévu les paramétrages permettant la généricisation du processus pour qu’il soit facilement utilisable pour d’autres instruments de recherche.

Le choix d’un format de restitution

Le choix d’un format n’allait pas de soi. Le but étant de produire de la manière la plus automatisée possible un document imprimable de très grande qualité, plusieurs options se présentaient, chacune avec avantages et inconvénients.
Les hésitations ont porté sur

  • Le format PDF, relativement facile à générer, largement répandu, utilisé par les imprimeurs, mais présentant l’inconvénient de ne pas être facilement retouchable.
  • Un format lié à un logiciel de PAO, idéal pour la mise en page, utilisé, bien sûr par les imprimeurs, mais nécessitant des compétences présentes seulement dans certains services d’archives.
  • Un format lié à un logiciel de traitement de texte, maitrisé par une grande majorité d’archivistes, facile à retoucher. On pouvait hésiter entre un logiciel open source, comme Open Office, mais qui présente le handicap majeur de ne pas gérer les gros documents et qui, de plus, connait des vicissitudes depuis le rachat de Sun par Oracle.

Le choix final s’est finalement porté très prosaïquement sur MS Word, que chacun ou presque maitrise et qui supporte de très gros documents (nous avons pu tester sur des instruments de recherche de plus de 2.000 pages).

L’instrument de recherche comme un kit assemblable

Outre le corps, présent aussi bien pour les instruments de recherche « classiques » qu’électroniques, l’instrument de recherche imprimé peut présenter des parties additionnelles comme préface, introduction, annexes, index, glossaires, bibliographies, tables de concordance, des illustrations et des matières…
Arkhéïa propose des formulaires pour la saisie des parties « non-EAD » et de les restituer à la demande.
Un pied de page, avec fil d’Ariane et pagination, un calcul automatique de la table des illustrations (à partir des légendes des images) et de la table des matières avec renvois aux pages sont également générés.

La gestion des illustrations

Un instrument de recherche bien présenté peut être attractif. Il le sera d’autant plus s’il est illustré. La gestion des illustrations est donc une partie importante (et délicate) dans la réalisation de l’instrument de recherche.
L’objectif, ici encore, était d’automatiser le plus largement possible la production et la mise en page de l’instrument de recherche.
Les dimensions des images sont recalculées automatiquement en fonction des dimensions originelles et de la largeur disponible (selon le niveau de description).
Une interface de gestion des images a été ajoutée, permettant, entre autres, de scruter des dossiers pour relever les noms et dimensions des images qu’il contient.

Un outil paramétrable pour tout type d’instruments de recherche

L’objectif initial était de permettre des impressions de grande qualité pour des instruments de recherche « classiques ». Cet objectif semble largement atteint à l’écoute des réactions des archivistes qui ont pu examiner les résultats.
Mais, de plus, le souhait a été exprimé d’utiliser les mêmes possibilités pour des bordereaux de versement. Anaphore y a travaillé également.
Afin de permettre des utilisations souples et variées de la génération d’instruments de recherche imprimables, de nombreuses options d’utilisation sont intégrées ou prévues grâce à des paramétrages.

Les étapes suivantes, en fonction des demandes et réactions des différents utilisateurs, consisteront à permettre un encore plus grand nombre de restitutions variées grâce à des paramètres supplémentaires, toujours simples à mettre en œuvre.

Plusieurs formes de disponibilités

L’instrument de recherche au format traitement de texte peut être conservé comme tel et converti au format PDF. Les utilisations possibles en sont nombreuses, certaines ont déjà été évoquées, nous en donnons une petite liste ici :

  • Aide à la relecture, facilitée par une présentation claire, lisible, agréable.
  • Restitution directe sur les imprimantes du service, sans ou avec couleurs, pour la mise en disposition en salle de lecture.
  • Édition par l’intermédiaire d’un imprimeur auquel on fournit un fichier PDF de haute qualité.
  • Mise à disposition, si le service le désire, d’une version PDF téléchargeable par les internautes, leur permettant de disposer d’une version complète de grande qualité.