Tous les billets avec l'étiquette mise en ligne

Contre-jour sur l’océan Atlantique à Biarritz. © Photo Myriam Pauillac

La description archivistique à l’ère du numérique – Part 2

Diffuser les descriptions archivistiques

Il ne s’agit pas de se contenter des constats précédents. Il ne s’agit pas, non plus, de prétendre régler toutes les questions complexes qui peuvent se poser. Mais il s’agit de réagir face à une forme de paresse qui consiste à laisser faire, à vouloir croire que les promesses de la techniques et surtout celles de ses vendeurs nous dispensent de réfléchir à l’élaboration de cette nouvelle culture indispensable et d’apporter, chacun, notre modeste pierre à l’édifice.

Anaphore tente, à son niveau, de le faire avec ses outils informatiques.
Les descriptions sont saisies dans le logiciel Arkhéïa Aide au classement et stockées dans un système de gestion de bases de données. Ces données descriptives peuvent ensuite être assemblées et restituées automatiquement en différents formats informatiques et selon différentes formes élaborées. Nous en sommes, en effet, arrivés à la conclusion que la restitution des descriptions au seul format XML EAD, ensuite transformé, était loin d’une solution optimale. Les descriptions archivistiques, par leur complexité mais aussi leur richesse, méritent non seulement d’être mises en valeur, mais aussi organisées et formatées en fonction de leurs destinations.
Ces destinations vont au moins dans deux directions :

  • Des descriptions archivistiques destinées à être lues directement par les humains
  • Des descriptions archivistiques destinées à être traitées par des machines.

Dans les deux cas ci-dessus, on va rencontrer plus que des variantes :

  • On ne traitera pas tout à fait de la même façon un instrument de recherche destiné à être lu sur papier et un instrument de recherche à lire sur un écran (d’ordinateur, de tablette, de téléphone).
  • Les données descriptives exploitables par un moteur de recherche interne à un site internet ne seront pas forcément organisées de la même façon que celles destinées au vaste réseau des données liées.

editorialisation 2

A. Faire renaître les instruments de recherche

On pourrait retourner la fameuse phrase de Giuseppe Tomasi di Lampedusa dans son roman Il Gattopardo (Le Guépard) : « Se vogliamo che tutto rimanga come è, bisogna che tutto cambi ! », souvent traduite, en français, « Il faut que tout change pour que rien ne change ».

Il faut donc, dans un premier temps, que rien ne change pour que tout change. À l’ère du numérique, les instruments de recherche conservent toute leur place, aussi bien en version imprimable qu’en version en ligne, pour offrir aux publics, aussi bien qu’aux archivistes, une possibilité d’appréhension à la fois globale et détaillée des fonds et collections. Malgré les critiques que nous avons reproduites précédemment, de vrais instruments de recherche conservent toute leur place et leur intérêt essentiel. Certes, leur appréhension peut demander quelques efforts de la part de ceux auxquels ils s’adressent ; efforts qui peuvent être minimisés par ceux qu’auront consentis les archivistes pour les rendre plus lisibles, plus agréables à consulter.
Les informations de contextualisation, les présentations de la méthodologie suivie, des compléments comme les glossaires, les tables de sigles éventuels… sont essentiels pour prévenir ou en tout cas limiter l’obsolescence culturelle à venir. Les bonnes vieilles introductions littérales de nos instruments de recherche, les annexes – que l’informatisation a poussé à réduire pour entrer dans le moule de la norme et surtout du format standard – doivent revenir d’actualité.

Anaphore a beaucoup travaillé, depuis un an environ, à la production automatique d’instruments de recherche mis en forme. Il s’agissait de prendre en compte l’équivalent des étapes d’édition et de publication signalées par Baptiste de Coulon. Nous parlons plutôt d’éditorialisation (suivant le terme forgé par Bruno Bachimont) puisqu’il ne s’agit pas, dans notre cas, de partir seulement d’un document rédigé (dans une étape de rédaction), mais de données descriptives saisies, que le logiciel assemble pour produire un document élaboré (des données vers un document).
Jean-Michel Salaün parle de redocumentarisation. On lira avec intérêt, par exemple, son article Pourquoi le document importe  où l’on pourrait voir comme un plaidoyer indirect en faveur de nos instruments de recherche-documents.

« Ainsi, la transformation du document par le numérique, voire son effacement au profit des données, n’est pas une évolution anodine. C’est un symptôme important de modifications de la régulation de nos sociétés, jusqu’à l’organisation de nos vies quotidiennes. Cette transformation modifie notre relation au savoir et elle marque un rapport différent à notre passé. Elle a un impact sur l’évolution de la notion d’information, sa conservation et sa transmission. »

Il fait, en effet, la distinction entre ce qu’il appelle protodocument et document : « un protodocument est une trace permettant d’interpréter un événement passé à partir d’un contrat de lecture. Un document est la représentation d’un protodocument sur un support, pour une manipulation physique facile, un transport dans l’espace et une préservation dans le temps. ».

On peut imaginer l’importance de ce travail d’éditorialisation ou redocumentarisation face à la solution de facilité qui consiste à mettre sur le web un peu n’importe quoi et, en tout cas, n’importe comment.

Notre travail a consisté, d’abord, avec les archives départementales de Vaucluse et la société Glanum, à la génération de fichiers que l’on peut directement imprimer sur son imprimante de bureau ou fournir à un imprimeur.
Ensuite, avec les mêmes partenaires, nous avons travaillé la génération d’une page HTML diffusable sur Internet. Cette page sera présentée plus en détail dans un futur post.
Dans les deux cas, il s’agissait de travailler à rendre lisible, compréhensible la complexité des instruments de recherche et à rendre ceux-ci aussi agréables que possible.
Il fallait donc, en particulier, régler au mieux la question de l’intelligibilité de la hiérarchie. Ce qui est moins difficile sur la version en ligne, en adoptant une forme s’apparentant au volumen, c’est-à-dire la possibilité de dérouler en continu l’instrument de recherche à l’écran où des filets de suite verticaux et un fil d’Ariane (en bas de la page) permettent toujours de situer le contexte.

PageHTML

B. Mais pas seulement

La critique vis-à-vis de la diffusion de données formulée par Jean-Michel Salaün, dans l’article cité, peut paraître sévère.

« Avec le nouveau millénaire, le document désormais numérique n’est plus, nous l’avons vu, qu’un ensemble de signaux dans un vaste flux. […]. Le document est aujourd’hui un ensemble de pièces éparses réagencées à la volée, une tête d’un réseau concrétisée par les liens hypertextuels, et les traces laissées par les internautes sont des outils de gestion du trafic et des stratégies des firmes. Tous ses éléments constitutifs sont bousculés et la notion de document elle-même est ébranlée.
Mieux ou pire, le Web de données, par ses capacités calculatoires, a l’ambition de reconstruire des documents à la demande, nous donnant l’illusion d’avoir toutes les réponses à nos questions avant même qu’elles ne soient posées, comme si notre futur était un destin déjà inscrit dans les machines ou comme s’il n’était que la solution d’un problème dont il suffirait de traiter les « données » par des algorithmes de plus en plus puissants. »

Il faut, nous semble-t-il, prendre cette citation comme un avertissement.
Trouver rapidement une information précise ou une série d’informations sur un sujet donné n’est pas à négliger. Simplement, on ne doit pas se contenter d’offrir des possibilités de recherche (plus ou moins – souvent moins – efficaces) mais on doit aussi offrir, suivant les termes de Baptiste de Coulon, des « supports fiables et efficaces de connaissances et d’apprentissage ». Pour cela, les compétences de l’archiviste et le sérieux du prestataire sont essentiels.
Ce serait une erreur de penser que les moteurs de recherche et autres technologies sont destinés à remplacer l’instrument de recherche document. Il faut voir ces différents outils comme complémentaires.

C. Optimiser la recherche

Si la plupart des sites internet d’archives ne brillent guère par la qualité de la restitution des descriptions, la performance de leurs moteurs de recherche n’est pas plus séduisante : souvent, en dehors des documents sériels (et encore !), on ne trouve rien ou pas grand-chose, quand ce n’est pas n’importe quoi.
On peut, là encore, nuancer avec Pleade qui intègre des fonctions de recherche efficaces, mais qui manquent de convivialité et ne correspondent pas aux attentes des publics aujourd’hui, qui ont du mal à s’y retrouver (« il faut avoir fait l’École des chartes… »).
Concernant ce sujet, on pourra se reporter au post qui présente les travaux effectués par les bibliothécaires auprès des publics et ont abouti à une nouvelle génération de moteurs. Nous aurons également l’occasion de présenter Bach, l’outil sur lequel nous avons travaillé depuis deux ans.
Mais, les performances de la recherche dépendent très étroitement, contrairement à ce que des vendeurs ont voulu faire croire, de la qualité des descriptions, et de leur indexation. C’est donc en amont, par le travail de l’archiviste et par la qualité des outils de production des instruments de recherche, que se prépare leur efficacité.
Se pose aussi la question des formats utilisés. Le format EAD est-il le meilleur pour alimenter les moteurs de recherche ? Il faudra sans doute revenir sur cette question.

D. S’échapper de nos silos d’archives

Les sites internet d’archives constituent, comme d’autres, ce que l’on nomme des silos. Les descriptions y sont stockées en profondeur et pas très visibles sur le web. Par exemple, en schématisant, pour trouver quelque chose, on doit savoir où on doit chercher, dans quel « silo de données ». À l’inverse, quand nous faisons une recherche sur un moteur grand public, nous ne savons pas sur quel site vont se trouver les réponses à nos interrogations. La solution n’est pas dans le référencement auprès de ces moteurs grand public : pour les descriptions d’archives, il est souvent mauvais.
D’autre part, les descriptions de documents d’archives et des acteurs qui y sont liés ne sont pas sans relation avec d’autres données, soit dans d’autres institutions patrimoniales (autres services d’archives, bibliothèques, musées…) soit dans des outils grand public (Wikipédia…).
Face à ces constats, les portails (thématiques, régionaux…) ne constituent que des solutions partielles : ils étendent un périmètre de recherche, mais restent des silos, seulement un peu plus larges.

Ici on doit aborder très rapidement la question du web des données, des données liées.
On a vu que les instruments de recherche nous paraissent un moyen de restitution essentiel pour les descriptions d’archives. Sont-ils pour autant le seul moyen possible ? On en revient à la question des documents et des données (correspondant en gros au document comme trace et document comme source, repris par Baptiste de Coulon de Marie-Anne Chabin [1]) et à la remarque (que nous avons citée dans la première partie de ce post) d’Eric Lease Morgan.
Comme les bibliothécaires sont déjà bien engagés à le faire, les archivistes devront, eux aussi, inscrire leurs descriptions dans le réseau des données liées.
Anaphore s’est déjà bien préparée à cette évolution et Thomas Francart a présenté le travail fait sur une ontologie.
Travailler sur une ontologie pour les archives, alors que d’autres l’ont déjà fait et que le Conseil international des archives (CIA) s’y est attelé, peut paraître prétentieux de la part d’une société comme Anaphore. Mais, d’une part les travaux déjà conduits sont souvent partis sur des fondations fragiles (convertir des documents EAD en RDF alors qu’il est nécessaire de commencer par un modèle conceptuel, comme le fait le CIA), d’autre part notre responsabilité vis-à-vis de nos utilisateurs est de nous préparer dès à présent à ces évolutions, de manière à assurer une transition, au moins sans douleur si ce n’est en douceur. Anaphore peut d’autant mieux anticiper et préparer ces évolutions qu’elle fait de la veille depuis longtemps et que ses outils n’ont pas confondu format d’échange et format de stockage des données et ne sont donc pas prisonniers d’une syntaxe présentant des limites importantes et promise à une prochaine obsolescence.

En conclusion, forcément provisoire

Comme souvent, les nouvelles technologies ont pu être présentées comme solution miracle qu’on est obligé de vénérer, sauf à vouloir passer pour rétrograde. Se met alors en place une nouvelle forme de pensée magique. N’a-t-on pas lu que le logiciel Machin apportait « un vrai bonheur » !
Les nouveaux mages ont tout intérêt à vendre la croyance que leur outil va faire le travail à notre place. C’est, bien entendu, une illusion totale et, après les illusions, viennent les désillusions. Entre les deux, on a gaspillé beaucoup de temps, d’énergie et d’argent.

Prendre de la hauteur, réfléchir à un modèle conceptuel – c’est-à-dire aux relations qui existent entre des entités que nous manipulons (ressources archivistiques ; agents comme producteurs, gestionnaires, sujets de ces ressources ; lieux, événements, concepts… comme sujet également ; etc.) et à la manière de formaliser ces relations – est une façon, pour les archivistes, de faire face à une urgence : celle de se réapproprier l’essence de leur travail que les évolutions récentes ont eu tendance à abandonner aux techniques et aux techniciens.
Travailler sur la qualité des descriptions, sur leur indexation, sur la lisibilité des instruments de recherche, sur l’usabilité ou l’ergonomie des moteurs de recherche et des sites internet ne nécessite aucune maitrise du code informatique. Et, il faut se souvenir que les informaticiens, que ceux qui produisent des sites internet sont généralement très loin de détenir ces compétences.

Cela a sans doute été une grave erreur de réfléchir insuffisamment à ces questions, de laisser trop de pouvoir aux techniciens et aux commerciaux car, comme le dit encore Jean-Michel Salaün dans les dernières lignes de son article, avec lesquelles nous terminerons :

« Ces changements ne sont évidemment pas une simple conséquence de choix techniques, ils accompagnent des évolutions sociales et sémantiques profondes. Ils mériteraient une meilleure discussion collective, une méditation sociétale pourrait-on dire, où les sciences humaines et sociales, en particulier les sciences de l’information, ont un rôle spécifique à jouer. ».

 


  1. Chabin, Marie-Anne, 2004, Document trace et document source. La technologie numérique change-t-elle la notion de document ? in Information – Interaction – Intelligence, vol 4, no 1, p. 141-158.
Rocher dans l’océan Atlantique à Biarritz. © Photo Myriam Pauillac

La description archivistique à l’ère du numérique – Part 1

« […] on peut, de façon polémique, se demander si la richesse (proportionnelle à sa rareté) de nos institutions ne serait pas plus leurs instruments de recherche que leurs fonds d’archives ? En effet, il nous apparaît […] qu’il est bien plus facile pour nous, archivistes, d’obtenir le don d’un fonds d’archives que d’en réaliser un inventaire scientifiquement valide et adapté à la diffusion numérique. »
Baptiste de Coulon

Nous avions eu l’occasion, il y a quelques années, de travailler un peu avec Baptiste de Coulon, archiviste suisse, et nous avons découvert récemment son mémoire qui pose une question intéressante :

« Les procédés actuels de mise en ligne permettent-ils aux inventaires d’archives d’être des supports fiables et efficaces de connaissances et d’apprentissage ? C’est-à-dire garantissent-ils les critères qui font, des inventaires, des documents de nature scientifique publiés ? » (p.8).

Cette question rejoint une partie de celles que nous nous posons, chez Anaphore. C’est pourquoi, si notre propos ici n’est pas de résumer le mémoire cité – que nous vous invitons à lire en ligne – il nous a semblé intéressant de partir de son travail, de ses constats pour présenter quelques réflexions.

Des bilans sévères

La réponse qu’apporte Baptiste de Coulon à sa question est assez clairement négative :

« La mise en ligne, ou autrement dit […] la publication sous forme numérique, peut être définie comme : l’accessibilité en ligne de document à contenu numérique.
Cette nouvelle opportunité de diffusion des documents a malheureusement tendance à se réaliser sans rapport avec la culture de l’imprimé précédemment exposée, et c’est là, pour nous, que réside une partie du problème. » (p. 26).

Il n’est pas le seul à faire ce genre de constat. Et pas seulement sur la qualité scientifique des descriptions mises en ligne, mais aussi sur leur lisibilité, leur ergonomie…

Bien entendu, les généalogistes constituent une catégorie particulière d’utilisateurs de sites internet d’archives, avec des buts précis. Ils s’intéressent principalement à des documents sériels. On connait par ailleurs leurs exigences. On sait que, par leur nombre – qu’ils ne se privent pas de rappeler (cf. ci-dessous) – ils constituent un puissant groupe de pression. Il est néanmoins intéressant et important de prendre en compte leurs remarques. Nous avons, par exemple, lu avec beaucoup d’attention le numéro spécial de la Revue française de généalogie paru en 2013 Archives en ligne : mode d’emploi.
On y trouve des constats à plusieurs niveaux. Nous nous contenterons de quelques citations.
Sur le vocabulaire des archivistes : « Comme les archivistes ont oublié de parler français, voici une petite traduction » (p. 40).
Sur les instruments de recherche : « vous passez obligatoirement par les inventaires en ligne, ce qui est un peu déroutant, car il faut en comprendre la logique. C’est une logique de classement et non pas d’utilisateur. » (p. 40).
Sur l’ergonomie des sites : « Ah, si tous les concepteurs de sites Web d’archives avaient demandé leur avis aux principaux utilisateurs – les généalogistes –, cela aurait évité, dans certains départements, de véritables parcours du combattant […] » (p. 7).
« La souplesse de configuration de […] fait que chaque département a pu développer son interface […]. Si bien que, sur les quinze sites web d’archives départementales sous […], on trouve le meilleur comme le pire. ». Le journaliste précise que, sur les quinze sites, seuls quatre « font figure de bons élèves ! » (p. 37).
Ces dernières remarques sont intéressantes dans la mesure où elles soulignent que, pour des problématiques identiques et en fait très simples, les archivistes et / ou leurs prestataires n’ont pas su trouver des réponses homogènes.

Autre public : nous avons eu l’occasion de parler de ces problématiques avec la précédente directrice des programmes de Wikimédia France. Alors que nous lui montrions un site Internet d’archives départementales à la conception duquel nous avions participé, elle a immédiatement douché la petite fierté que nous pouvions avoir « Il faut avoir fait l’école des Chartes pour utiliser ça ! » !
Eric Lease Morgan, bibliothécaire à l’Université Notre-Dame (Indiana), qui a écrit des textes intéressants sur les archives, affirme : « Finding aids impose a conceptual model on a collection from the point of view of the archivist. ». Cette affirmation méritera, évidemment, d’être approfondie un jour.

Il apparaît clairement que les réponses actuellement données à la problématique de la diffusion en ligne des descriptions d’archives ne donnent pas satisfaction aux utilisateurs potentiels et ceci même dans le cas – qu’on aurait imaginé bien géré – des documents sériels. Il nous faut donc nous demander pourquoi et tenter de trouver comment résoudre ce problème.
Ce billet ne prétend pas faire le tour d’une question aussi complexe, mais tente de fournir quelques éléments de réflexion.

Décrire les archives pour quoi, pour qui, comment, sous quelle forme ?

La norme ISAD(G), dans son introduction (p. 7, paragraphe I.2 de la version française), répond assez clairement à la question du « pour quoi » :

« L’objet de la description archivistique est d’identifier et d’expliquer le contexte et le contenu des documents d’archives, en vue de faciliter leur accès. »

Le « pour qui, pour quels publics ? » est une question à laquelle on ne peut répondre que très partiellement, les publics étant en grande partie potentiellement futurs et donc nous ignorons très largement ce qu’ils seront, ce qu’ils chercheront et même, plus important, ce qu’ils pourront comprendre demain de ce que nous avons consigné aujourd’hui (Bruno Bachimont, dans différentes publications, envisage l’obsolescence du point de vue de la lisibilité culturelle et parle de fossé d’intelligibilité). Cela nous incite encore à la modestie.

La question du « comment » est large. La norme ISAD(G), en particulier, mais aussi, avant elle, la pratique archivistique ont apporté une bonne partie des réponses à ces questions, même si celles-ci évoluent avec les techniques.
Dans la question du comment, on peut inclure la question de la forme. On a pu penser à un moment que la diffusion de formats standard, précisément le format XML-EAD pour les instruments de recherche informatiques, avait répondu à cette question. Mais, il nous semble que la réponse n’est que très partielle. Et il nous semble aussi qu’elle méritera vraiment d’être reposée et approfondie.

L’instrument de recherche

Pour les archivistes, la forme privilégiée pour « matérialiser » la description archivistique est l’instrument de recherche.
Si le terme d’instrument de recherche est parfaitement parlant pour les archivistes, il est assez ésotérique pour le public.
Il n’est finalement pas si facile de trouver une définition précise de l’instrument de recherche. Lorsque l’on cherche « instrument de recherche archives » sur Internet, la première référence qui apparaît est, bien sûr, celle de Wikipédia. L’instrument de recherche y est entendu dans un sens plutôt large quant à sa forme :

« Dans les archives, un instrument de recherche est un ouvrage, un fichier ou une base de données qui décrit le contenu d’un ensemble de documents conservés par un service d’archives. Destiné au public extérieur à ce service, il a pour but de permettre au chercheur de repérer rapidement les documents utiles à sa recherche. Il fournit des indications plus ou moins détaillées sur le contenu de chaque article (l’article est l’unité intellectuelle et matérielle de base des archives, identifiée par une cote). »

Pour notre part, nous entendrons ici l’instrument de recherche dans un sens plus restrictif et classique, d’un document structuré organiquement, et non d’une collection de données descriptives (comme un tableau ou une collection de fiches à plat). Nous considérons également que l’instrument de recherche suppose l’élaboration d’une mise en forme.

Des constats

A. Une absence de culture ?

1. La culture de l’imprimé

Revenons à Baptiste de Coulon :

« Pour comprendre quels sont les critères formels propres à garantir à l’inventaire d’être un support fiable et efficace des connaissances et de l’apprentissage, il nous faut revenir à l’étude des fondements de la culture de l’imprimé. Cela peut paraître lointain, mais c’est bien en conséquence de cette invention que s’est mise en place une grande partie de notre économie du savoir. » (p. 18).

L’auteur s’appuie sur la publication d’Elizabeth L. Eisenstein La révolution de l’imprimé à l’aube de l’époque moderne (dont on trouvera une présentation et les références précises ici ) qui, elle-même, fait suite aux travaux de Marshall McLuhan.
On peut par ailleurs également rappeler l’ouvrage de Jack Goody La raison graphique – la domestication de la pensée sauvage. Paris, Les Éditions de Minuit, 1979, que nous avons déjà cité dans ce blog (billet Numérisation et informatisation (Part I)).

Cette notion de culture de l’imprimé est essentielle. Très schématiquement, pour ce qui nous intéresse ici, avec le temps se sont mis en place des ensembles de codes de représentation qui ont amélioré la lisibilité et la compréhensibilité des textes. Ces codes de représentation ont été intégrés dans un patrimoine commun, une culture commune. On retrouve ici la notion de lisibilité culturelle de Bruno Bachimont.

Baptiste de Coulon rappelle que la réalisation d’un imprimé suppose un certain nombre d’étapes : la rédaction, l’édition et la publication (p. 21-22).

2. La culture de l’imprimé s’applique-t-elle aux inventaires ?

La codification des représentations a-t-elle été menée à son terme pour les instruments de recherche archivistiques imprimés ?
Ces documents présentent un certain nombre de difficultés particulières.

  • Les instruments de recherche n’appartiennent pas à une culture commune très largement partagée. On a rapporté, ci-dessus des remarques d’origines diverses.
  • Rendre lisible un instrument de recherche est un véritable défi. En effet, il s’agit d’une part de bien individualiser les différentes descriptions correspondant aux différentes ressources décrites (en général les articles, qui portent un cote) et, d’autre part, de rendre intelligible la structuration hiérarchique (organique). Or, ces deux objectifs ont quelque chose d’a priori incompatible.
  • Les choses sont compliquées par la variabilité des descriptions, par exemple leur volume qui peut aller de l’inscription d’une simple année à un texte très conséquent.

S’il y a des points communs entre les différents inventaires produits par les différents services d’archives, on ne peut pas dire qu’il existe vraiment un langage graphique commun.

  • Le plus souvent, mais pas toujours, la cote est mise en évidence, dans une colonne à part, à gauche. Cette option présente un avantage, celui d’offrir un repère visuel qui scande bien les différents articles. Mais elle présente le défaut majeur de limiter la place restant pour développer les descriptions dès que celles-ci sont volumineuses. Ceci d’autant plus que l’on utilise généralement des indentations pour marquer les niveaux hiérarchiques. Enfin, la cote n’est intéressante que lorsque l’on a repéré, grâce à la description, un document qui nous intéresse : c’est donc seulement en fin de recherche qu’elle peut, éventuellement, nous concerner pour commander le document (ou simplement la noter). Et, dans le cas où les documents sont mis en ligne sous forme numérisée, la cote n’a qu’un intérêt pratique limité.
  • La description est ainsi souvent disposée en deux parties, parfois 3 avec la cote, le texte et les dates.
  • Les formats des instruments de recherche imprimés sont très variables de l’in-4°, voire plus grand, à l’in-8°.
  • Sur une page, les descriptions peuvent être disposées sur une seule colonne ou deux, voire trois.
  • La principale difficulté reste la représentation de la hiérarchie, que la plupart des instruments de recherche papier ne parviennent pas à gérer. La hiérarchie peut être traitée par des retraits progressifs, mais, dès qu’une série d’articles se trouve sur plus d’une page, on perd le fil des niveaux parents. La forme codex (livre), si elle présente de nombreux avantages par rapport au volumen (rouleau) constitue, dans ce cas, un handicap. Les retraits sont d’autant plus utilisables que le format est grand et, comme on l’a vu, qu’une partie de l’espace disponible n’est pas neutralisée par la position de la cote, voire de la date.

Nous aurions tendance à affirmer que la culture de l’imprimé n’est pas complètement aboutie en ce qui concerne les instruments de recherche d’archives. Néanmoins, il faut souligner que de véritables travaux en ce sens ont été conduits. Nous ne citerons qu’un exemple récent, celui de l’Inventaire du fonds François de Menthon publié par les archives de la Haute-Savoie en 2012. Grand format ; illustration abondante ; usage de la couleur ; indentations et utilisation de chevrons pour la hiérarchie dont un niveau est repris en en-tête de page. Les articles sont scandés par des filets séparateurs, mais les cotes, en gras et rouge, continuent à occuper un large espace à gauche. Ce travail a constitué une source d’inspiration pour celui que nous avons conduit, avec les archives de Vaucluse, pour le fonds du duché de Caderousse.

3. La culture de l’imprimé s’applique-t-elle au numérique ?

Pour Baptiste de Coulon, le problème, avec le numérique, est l’ignorance de la culture de l’imprimé. Rappelons cette phrase déjà citée plus haut.

« Cette nouvelle opportunité de diffusion des documents a malheureusement tendance à se réaliser sans rapport avec la culture de l’imprimé précédemment exposée, et c’est là, pour nous, que réside une partie du problème. » (p. 26).

Il est possible d’aller un peu plus loin. Certes, les acquis accumulés lors de l’élaboration de la culture de l’imprimé sont en bonne partie réutilisables pour le numérique et ne doivent pas être négligés, mais c’est sans doute, au-delà, une nouvelle culture qui reste à forger. Souvenons-nous de la raison computationnelle que Bruno Bachimont fait succéder à la raison graphique de Jack Goody.

Dans tous les cas, nous pouvons, avec Baptiste de Coulon, constater et déplorer une « absence de culture » dans la plupart des mises en lignes de descriptions d’archives.

B. Vers la fin des instruments de recherche ?

Lors de la diffusion de la DTD EAD, on a pu annoncer la « fin des instruments de recherche imprimés ». On peut se demander, avec le recul, si l’on n’a pas assisté à la quasi-disparition des instruments de recherche tout court.
Quand on fréquente de nombreux sites d’archives, on a du mal, en effet, à y retrouver des instruments de recherche.
Sur les uns, on trouve des « arbres » qui se déplient laborieusement, qui vous repositionnent malgré vous tout en haut quand vous pensez avoir enfin réussi à atteindre la description qui vous intéresse.
Lors d’un stage organisé à Barbentane début juin 2014, nous avons rapidement exploré les sites des services de certains stagiaires. Dans certains cas, on se perd dans de véritables labyrinthes quand on ne se retrouve pas – après un parcours du combattant, et un clic sur « accès inventaire »… – sur la page d’accueil, ou sur une « erreur 404 ».
Parfois, les instruments de recherche sont bien présents, mais sous forme d’affreuses images d’un vieux tapuscrit, ou d’un fichier pdf difficilement lisible et qui ne procède d’aucun réel effort de mise en forme !

Extrait_IR

Ci-dessus, extrait d’un exemple d’instrument de recherche mis en ligne par un prestataire sur un site d’archives départementales

 

Cette quasi-disparition des instruments de recherche procède d’une évolution récente. Pour les archives, la mise en ligne a commencé par celle de documents sériels numérisés qui ne demandait pas de compétences ni de culture particulières en archivistique. Des agences web ont tout naturellement occupé ce terrain. La demande s’est ensuite élargie et les clients ont spontanément fait appel aux mêmes prestataires, la tendance générale étant de chercher un interlocuteur unique (à qui confier des tâches nécessitant des compétences complètement distinctes !). Pour ces prestataires, il apparaissait possible de faire de bonnes affaires facilement, sans nécessité d’investir dans l’élaboration d’une nouvelle culture numérique archivistique, sans exigence de qualité ni de respect des utilisateurs. Il suffisait de présenter une jolie vitrine et de mettre en avant trois lettres magiques : E, A, D.
Ce constat doit être un peu nuancé en ce qui concerne des outils comme Pleade et Arkhothèque (qui s’en est inspiré) qui présentent ce qui s’apparente nettement plus à un instrument de recherche dans lequel on peut naviguer. Toutefois, à un moment donné, si l’arbre de navigation donne une vue globale sur les documents décrits, les détails des descriptions ne s’affichent généralement qu’un à un.

Mais, suivant la devise de ce blog « L’histoire continue » et une nouvelle culture reste à élaborer, pierre par pierre : à chacun d’apporter la sienne, même toute petite.

À suivre…

Tranche de pin aux Baux de Provence, dans les Alpilles ©Anaphore

Diffusion de données nominatives associées aux images de documents
Le projet des archives départementales de Vaucluse

La réflexion de Louis Colombani sur la préparation de la mise en ligne des registres de recrutement militaires me donne l’occasion de partager via le blog d’Anaphore les idées et les envies des archives départementales de Vaucluse dans ce domaine.

Contrairement, peut-être, à d’autres départements dont la démarche de mise en ligne des images des registres matricules est déjà « ancienne », les archives départementales de Vaucluse ont démarré leur projet dans le cadre de l’incitation des archives de France en janvier 2013. Elles ont donc appuyé leur projet sur les recommandations nationales.
Après le début du projet vauclusien, en février 2014, ont été diffusées des recommandations pour l’indexation des images numérisées des registres de matricules militaires dans le cadre du « Grand Mémorial ».

Les données produites

Numérisation et indexation

Dans le Vaucluse, la série des registres matricules débute en 1864.

Les archives départementales de Vaucluse ont numérisé :

  •   l’ensemble des tables alphabétiques de 1865 (il n’existe pas de table pour l’année 1864) à 1940. Les images des tables de 1865 à 1938 sont consultables en salle de lecture, via l’application Pleade.
  •   les registres matricules de 1864 à 1921, les années 1887 à 1921 étant définies comme prioritaires. Ces images ne sont pas encore diffusées en ligne.

Les archives départementales ont créé une base de données nominative pour les registres matricules des hommes des classes 1887 à 1921 (nés entre 1867 et 1901). Ces registres correspondent en effet aux classes qui ont participé à la Première Guerre mondiale dont les commémorations nationales débutent cette année. La base de données contiendra à terme un total d’environ 60 000 hommes.

Structuration des données

Images

Sur la période 1887-1921, une classe compte 4 registres (plus une table alphabétique).
Ex. La classe 1887 comporte 4 registres, cotés 1 R 1189 à 1192.

Chaque registre compte 500 hommes environ et chaque homme est pourvu d’une fiche d’une page, mais cette page peut être éventuellement augmentée de « retombes », pièces de papier collées et repliées, soit, en tenant compte des « retombes » 500 à 1 000 images par registre.

RetombeExemple de retombe, repliée à gauche, dépliée à droite

 Les images sont au format jpeg et leur nommage est constitué de l’identifiant du service + cote + classe + n° de la photo.
Ex. FRAD084_01R1189_1887_0004.jpg

Les photos numériques sont regroupées par registre. Chaque répertoire d’images est désigné par l’identifiant du service + cote + classe.
Ex. FRAD084_01R1189_1887

Indexation

Les données sont constituées sous la forme d’un fichier Excel alimenté pour une part par le prestataire qui effectue la numérisation, pour une part par le service des archives départementales.
Conformément aux recommandations ministérielles de 2013, les champs retenus sont les suivants :

  • cote,
  • classe,
  • n° matricule,
  • département d’enregistrement du matricule,
  • pays d’enregistrement du matricule,
  • nom,
  • prénoms,
  • année de naissance,
  • département de naissance,
  • localité de naissance,
  • pays de naissance,
  • premier identifiant image,
  • dernier identifiant image.

Seuls trois champs proposés par les Archives de France en 2013 n’ont pas été retenus :

  • bureau de recrutement,
  • département de domiciliation lors de l’enregistrement,
  • localité de domiciliation lors de l’enregistrement.

Par rapport aux recommandations de février 2014, les champs suivants n’ont pas été indexés :

  • profession,
  • degré d’instruction générale.

Le moteur Généalogie/Grand Mémorial

Les archives départementales de Vaucluse souhaitent que leur base de données « registres matricules » soit interrogeable via le moteur de recherche du ministère de la Culture « Généalogie », et plus précisément de sa déclinaison « Grand Mémorial », qui sera capable de prendre en compte tous les champs d’indexation recommandés.
Le moteur ramène les résultats sous la forme de liens vers une notice ou une image, qui doit préalablement avoir été mise en ligne.

La procédure d’intégration débute par un questionnaire de paramétrage technique qui comporte, en annexe, le schéma d’export XML (schéma Nomina) « à respecter, autant que faire se peut ».

Deux points doivent donc être réglés :

  • la mise en ligne des notices et/ou des images des registres matricules,
  • la concordance entre le fichier Excel d’indexation et le schéma Nomina.

Mise en ligne des notices et/ou images des matricules

La solution qui a paru techniquement la plus pertinente à la Direction des services informatiques est de relier le moteur à une notice locale, elle-même reliée à une ou plusieurs images.
C’est le choix fait par les services qui ont déjà intégré Généalogie (2 à ce jour pour les matricules, l’Ain et la Mayenne).

Ci-dessous, exemple de l’Ain : recherche sur le nom Martin.

Ce choix nécessite l’existence d’une application locale pour l’affichage des notices nominatives et des images liées. À ce jour, les AD de Vaucluse ne disposent pas d’un tel outil.
La société Anaphore a développé une application, dénommée « Bach », capable de prendre en compte et de mettre en ligne à la fois les données nominatives et les images.

Version de démonstration de Bach

Concordance avec le schéma Nomina

La DSI du département de Vaucluse a proposé de générer, à partir du fichier Excel, le fichier XML conforme au schéma Nomina. Afin de préparer cette transformation, les archives de Vaucluse ont modifié le fichier Excel de départ pour qu’il comporte toutes les données attendues par le schéma Nomina.

Extrait de la base de données Excel conforme au schéma Nomina

De son côté, la société Anaphore a également prévu de développer dans son progiciel Arkhéïa-Aide au classement la possibilité d’importer les données nominatives saisies dans Excel pour pouvoir restituer facilement pour les utilisateurs d’une part un fichier XML Bach, d’autre part un fichier XML Nomina (pour Généalogie/Grand Mémorial).

Le schéma suivant établit les correspondances entre le schéma conceptuel Nomina et les données créées par les archives départementales.

La base vauclusienne comprend 2 données de localisation : lieu d’enregistrement du matricule et lieu de naissance ; et 2 données date : année d’enregistrement, qui est en fait la classe d’intégration du jeune homme et année de naissance. Elle comporte également 3 compléments : l’indication de présence d’une image, le n° de matricule et la cote.

Correspondance entre la BDD des AD de Vaucluse et le schéma Nomina

Le schéma Nomina attend autant de fichiers XML que de matricules (donc autant de fichiers XML que de lignes de la base de données nominative). Ceci permet le moissonnage régulier des données modifiées uniquement (au lieu de réimplanter l’ensemble de la base, y compris les données n’ayant subi aucune modification).

Attentes vis-à-vis de l’application Bach d’Anaphore

P
our la réalisation de leur projet, les besoins des archives départementales de Vaucluse sont d’un outil :

  • de mise en ligne des données nominatives
  • qui garantisse la sécurité des données nominatives qu’il contient
  • de mise en ligne des images des registres, reliées aux données nominatives, qu’il y ait une ou plusieurs images reliées à un matricule
  • qui intègre la validation d’une licence-clic pour accéder aux images par cohérence avec les autres accès aux images offerts par les archives départementales de Vaucluse
  • compatible avec l’utilisation du moteur Généalogie/Grand Mémorial. Bach doit être capable d’afficher la notice de résultat correspondant à l’interrogation formulée dans Généalogie/Grand Mémorial
  • proposant des URL pérennes pour les données reliées à Généalogie/Grand Mémorial
  • qui permette d’ajouter des données (nominatives + images) au fur et à mesure de l’avancement du projet
  • qui permette de faire des corrections et sur les données et sur les images si nécessaire (ajouts, modifications, suppressions)
  • qui permette que ces modifications soient prises en compte par Généalogie/Grand Mémorial.

Partenariat avec le Gard

Les archives départementales du Gard s’étant déjà décidées à utiliser Bach pour mettre en ligne leurs registres matricules dans quelques mois, les archives de Vaucluse ont souhaité s’associer à la démarche, afin de créer sur leur site Internet un espace complémentaire de consultation de leurs données nominatives.

Calendrier de mise en œuvre

La numérisation des registres matricules est achevée pour les classes 1887-1921 ; l’indexation en revanche est encore en cours chez le prestataire et en interne.
Toutefois, une partie des données et des images est déjà disponible. Il s’agit des images et de l’indexation correspondant aux matricules des classes 1887-1895 (registres 1 R 1189 à 1 R 1230), soit 15 900 hommes environ.

Deux temps forts sont prévus en 2014 dans le cadre de la commémoration de la guerre 14-18 : le 14 juillet et le 11 novembre.

La mise en ligne se fera de manière progressive, mais les Archives départementales de Vaucluse souhaitent pouvoir diffuser les premières données nominatives (au moins les 15 900 premiers matricules et davantage si possible) pour les célébrations du 14 juillet 2014.

Philosophie présentant les Sept Arts libéraux à Boethius, 1460 - 1470, Maître de Coëtivy The J. Paul Getty Museum, Los Angeles, Ms. 42, leaf 2v

Concevoir un accès aux instruments de recherche archivistiques

Julien Pomart nous livre son retour d’expérience à l’issue du travail de mise en ligne des instruments de recherche de la Fondation Maison des Sciences de l’Homme. Comme Anaphore le fait souvent, il s’est agi, sur ce dossier, d’instaurer un dialogue, un niveau de questionnement avec l’archiviste afin de révéler ce qui, dans l’organisation initialement proposée, reflétait véritablement le caractère organique des fonds.
En effet, faire émerger le caractère organique des contenus consignés a constitué le premier objectif de la démarche :

  • par l’application au premier degré du principe de respect des fonds, c’est-à-dire identifier la ou les entités productrices
  • et, au second degré de ce même principe, par le respect de l’ordre primitif ou originel des documents.

C’est dans un second mouvement que nous nous sommes intéressés à la stratégie de mise en ligne à proprement parler, à la définition des clés d’accès et de l’offre d’accès aux contenus voulue par l’archiviste.

Dans l’histoire d’un service d’archives, la mise en ligne des instruments de recherche qu’il produit constitue une étape majeure, voire symbolique, l’archiviste livrant aux internautes le fruit de son travail de collecte, de classement et de description des fonds dont il assure la gestion. En effet, le rôle de l’archiviste est avant tout de porter l’existence de sources primaires à la connaissance des publics.

Pour le pôle archives de la FMSH, l’année 2013 fut notamment marquée par la conception ainsi que la mise en ligne de la plateforme de consultation de ses premiers répertoires et inventaires en XML-EAD, créés à partir de 2012. Un tel projet nécessite de se poser les bonnes questions et d’évaluer ses enjeux en matière de médiation avec les publics.

Les principes directeurs

La conception d’une plateforme de consultation d’instruments de recherche archivistiques est une démarche qui implique plusieurs problématiques.

A qui s’adresse l’application ?

Les contenus archivistiques sont produits à destination d’un public, et même de publics, qu’il est nécessaire d’identifier au préalable afin de répondre du mieux possible à leurs besoins. De manière générale, le premier public ciblé est celui des chercheurs et étudiants, cependant il ne faut pas oublier le public « interne » composé de l’ensemble des acteurs d’une institution, ce qui inclue aussi bien sa gouvernance que son personnel administratif. En outre, au sein de ces catégories de publics, on pourrait distinguer plusieurs types d’usagers :

  • ceux qui connaissent l’application de consultation des contenus archivistiques et en prennent connaissance,
  • ceux qui s’adressent directement au service d’archives par téléphone, par courriel, ou en salle de lecture,
  • et puis, ceux qui utilisent ces deux solutions, somme toute complémentaires : d’abord l’utilisation de l’application web afin de prendre connaissance des fonds de manière générale, puis prise de rendez-vous avec l’archiviste. Ou alors découverte de l’application après échanges avec le service des archives.

Quelles sont les habitudes de consultation en ligne ?

L’utilisation des moteurs de recherche sur le web a introduit chez les internautes de nouvelles pratiques de recherche d’informations et de ressources. Plus de 80 % des internautes utilisent la fonction de recherche simple. Il ne faut cependant pas négliger d’autres types d’usages afin de ne pas oublier une partie des publics : exploration de l’état des fonds, utilisation des formulaires de recherche avancée, navigation d’un contenu à un autre via les termes indexés, etc.

Quels sont/seront les contenus à publier à court, moyen et long termes ?

S’il peut être délicat pour l’archiviste d’anticiper les futurs usages, il possède néanmoins le contrôle sur les contenus qu’il souhaite mettre en ligne à court, moyen et long termes. L’enjeu est en effet de concevoir un accès à des instruments de recherche qui n’existent pas encore. Cela est particulièrement vrai dans le cas des archives de la Fondation Maison des sciences de l’homme. En 2013, les répertoires créés depuis l’informatisation du service en 2012 s’élevaient au nombre de six et étaient loin de représenter toute la diversité – mais aussi la richesse du fonds. C’est donc la connaissance de ce fonds que possède l’archiviste qui a guidé l’élaboration de la plateforme de consultation, censée être adaptée à l’ensemble des contenus archivistiques présents et à venir : 1 an, 2 ans, 5 ans, 10 ans…

Dans quels environnements professionnel et numérique doit prendre place l’accès aux contenus archivistiques ?

Penser l’accès aux archives de manière isolée et déconnectée de l’environnement immédiat du service d’archives ainsi que des tendances globales peut s’avérer dommageable dans la mesure où l’application risque de se retrouver rapidement en non-conformité, soit avec la politique institutionnelle en matière de « numérique », soit avec les normes métiers en vigueur. Au sein de la FMSH et plus particulièrement de la bibliothèque, cela s’est traduit par :

  • un examen des pratiques des bibliothécaires afin de repérer de potentielles clefs d’accès à l’information communes entre bibliothèques et archives,
  • l’élaboration d’une application qui s’articulerait correctement avec les autres projets à venir, en particulier la mise en place d’un portail d’accès unique au catalogue des imprimés, aux ressources électroniques, aux bases de données et instruments de recherche archivistiques.

La structuration des contenus archivistiques : de l’état des fonds aux instruments de recherche

La connaissance des fonds d’archives que possèdent les archivistes peut être délicate à restituer aux usagers.

De quelle manière les présenter ? Deux notions sont capitales: contextualisation et hiérarchisation de l’information. Le pôle Archives a travaillé sur cette application en suivant un principe primordial en archivistique : décrire du général au particulier en évitant les redondances.

La création d’un état des fonds électronique constitue une étape incontournable : il va en effet structurer de manière hiérarchique l’ensemble des contenus archivistiques qui seront mis en ligne progressivement et offrir à l’usager un aperçu global des fonds documentaires.

Dans le cas des archives de la FMSH, nous avons fait le choix de structurer cet état des fonds autour de trois ensembles :

  1. Le fonds de l’Association de la Maison des sciences de l’homme, structure ayant précédé la Fondation (il ne s’agit pas à proprement parler du fonds d’archives de la FMSH),
  2. Les archives institutionnelles de la Fondation, c’est-à-dire les documents produits et reçus par ses services et programmes,
  3. Les fonds entrés par voie extraordinaire (les dons).

Pour le fonds institutionnel ainsi que les fonds confiés à la Fondation, un second découpage organise les ensembles documentaires par acteurs et/ou activités. Cette structuration résulte d’un choix de l’archiviste de mettre en valeur les fonds et ne reflète pas nécessairement le cadre de classement des archives en vigueur.

Concrètement, des documents rangés côte à côte dans les dépôts ne retrouveront pas nécessairement la même proximité dans l’état des fonds. Alors que le cadre de classement est destiné à organiser les fonds de manière thématique, l’état des fonds vise à restituer l’organisation du ou des producteur(s). Les libellés des ensembles et sous-ensembles doivent à la fois refléter cette organisation et êtres clairs pour l’usager. La création d’un état des fonds peut, de ce fait, s’avérer délicate.

Soulignons ici le rôle non négligeable des différents interlocuteurs pouvant intervenir dans ce type de projet, notamment des éventuels prestataires : à l’origine, cet état des fonds était structuré très différemment et reflétait d’avantage un cadre de classement. C’est en partie grâce à l’expertise ainsi qu’au regard extérieur apportés par la société Anaphore, durant la phase de conception, que cette évolution a eu lieu. Cette intervention a en effet permis à l’archiviste de prendre de la hauteur par rapport à ses pratiques et son environnement institutionnel pour mieux voir les éléments à corriger.

Lorsque l’ossature est mise en place, il est ensuite aisé pour l’archiviste d’y greffer les instruments de recherche qu’il produit progressivement:

Reste un dernier choix à effectuer : faut-il présenter ici des fonds non traités et pour certains non communicables ?
Deux stratégies sont possibles :

  • Ne faire apparaître dans cet état des fonds que les archives classées et ayant fait l’objet d’une description archivistique au niveau de chaque dossier ou à la pièce, avec mise en ligne de l’instrument de recherche correspondant,
  • Ou, au contraire, présenter toute l’étendue des fonds conservés même s’il n’existe qu’une notice de fonds pour certains.

Compte tenu de la récence de la fonction archives de la FMSH, le Pôle Archives a opté pour une présentation de l’ensemble des ressources documentaires, sans se limiter aux archives traitées. En effet, chaque notice d’un fonds non classé, même incomplète, voire inexacte, constitue un accès à l’information pouvant toujours s’avérer utile. De plus, l’archiviste dispose de manière générale de quelques outils plus ou moins élaborés qui lui permettent de s’orienter dans le fonds et d’effectuer lui-même la recherche pour l’usager : bordereau de versement, listing sommaire, etc. et dont il pourra se servir pour renseigner au mieux les chercheurs.

L’interrogation des contenus archivistiques numériques

L’accès aux archives implique par ailleurs de permettre aux usagers d’interroger les instruments de recherche mis en ligne.

Les possibilités d’orientation de l’usager

Tous les moteurs de recherche proposent la possibilité d’effectuer des requêtes plus ou moins avancées. L’archiviste peut aller au-delà et proposer différents parcours de recherche qui vont aiguiller l’usager et donc enrichir l’expérience de recherche.

Dans le cas présent, il existe plusieurs possibilités :

  • effectuer une recherche simple (plein texte) dans l’ensemble des instruments de recherche,
  • élaborer une recherche plus sophistiquée, en combinant plusieurs critères, grâce à un formulaire d’orientation générale,
  • effectuer une recherche dans un périmètre limité ou aux archives institutionnelles de la FMSH ou aux fonds d’archives qui lui ont été confiés, au moyen des formulaires respectifs.

Cette dernière fonctionnalité permet de restituer la richesse des contenus archivistiques produits.

Le rôle de l’indexation réfléchie et contrôlée

Les formulaires d’orientation de l’usager sont bâtis à partir des clefs d’accès à l’information que constituent les termes d’index des instruments de recherche. La connaissance que l’archiviste possède des fonds et de ses usagers joue toujours un rôle central dans la conception d’une telle application. Deux problématiques simples ont guidé leur conception :

  • De quelle manière l’archiviste veut-il et peut-il mettre en valeur les fonds ?
  • Quels sont les principaux types d’information que les usagers recherchent ?

Pour la Fondation Maison des sciences de l’homme, nous avons opté pour la création de clefs d’accès mettant en avant les spécificités de ses fonds d’archives et de son action :

  • noms de chercheurs
  • disciplines scientifiques
  • services et programmes institutionnels
  • programmes scientifiques
  • manifestations scientifiques (colloques, séminaires, journées d’études, etc.).

A l’heure actuelle, peu de termes apparaissent car la production d’instruments de recherche électroniques est récente. Mais, au fur et à mesure de l’avancée des travaux de traitement des fonds, les listes de termes vont se nourrir de l’indexation et enrichir l’expérience de recherche. La création des contenus archivistiques et leur mise en ligne sont ainsi deux missions de l’archiviste étroitement liées et devant être assurées de manière concomitante. A contrario, un service d’archives dont la politique de mise en ligne n’intervient que bien après la création d’instruments de recherche en XML-EAD devra faire face à un manque d’index spécifiques à son institution. L’application de consultation risque donc de ne pas refléter toute la richesse des fonds dont il assure la gestion.

La restitution des résultats de requête

Les descriptions archivistiques sont organisées selon une arborescence hiérarchique. Si l’on souhaite conserver l’état d’esprit régissant cette règle, de quelle manière l’application doit-elle restituer les résultats de requêtes lancées par les usagers via le moteur de recherche ?
La création d’un état des fonds permet justement de respecter ce modèle structuraliste utilisé par les archivistes et de replacer les résultats des requêtes :

Ce type de restitution des résultats diffère du catalogue dans lequel les résultats sont affichés à la suite, sans arborescence :

Pour conclure : le « numérique », un accès aux archives parmi d’autres ?

Faut-il considérer une application de consultation des contenus archivistiques comme une fin en soi ? Pas nécessairement : la mise en ligne constitue une action visant à offrir de la visibilité aux documents d’archives, et la valorisation par des expositions, publications ou des opérations de numérisation constituent d’autres aboutissements du travail de l’archiviste. En réalité, il s’avère qu’aussi performants qu’ils peuvent l’être, les contenus archivistiques mis en ligne ne constituent qu’une manière d’accéder à l’information complémentaire aux autres.

L’archiviste, de par sa connaissance des fonds mais aussi de l’histoire de son institution, reste un interlocuteur de premier ordre vers l’accès aux archives : mettre en ligne les contenus archivistiques ne signifie pas laisser les usagers seuls face aux instruments de recherche. L’archiviste, comme le bibliothécaire, accueille, écoute et oriente toujours le chercheur, restant ainsi au contact de la communauté scientifique et de la recherche actuelle.

N’oublions pas non plus qu’avant d’être numériques, les instruments de recherche ont connu le support papier. Quand bien même les répertoires et inventaires électroniques présentent de nombreux avantages, difficile de tirer un trait sur une culture papier vieille de plusieurs siècles :

  • une partie du public des archives a pris des habitudes de consultation bien ancrées dans leurs pratiques de recherche, habitudes d’autant plus persistantes du fait que bon nombre de services d’archives mettent uniquement des instruments de recherche papier à la disposition des usagers,
  • le papier se prête particulièrement à la consultation intégrale d’un répertoire ou d’un inventaire, non seulement pour le confort de lecture qu’il offre, mais aussi de par la structuration et l’affichage de l’information qui se trouve directement accessible au lecteur, sans qu’il ait besoin de déplier toute la hiérarchie de l’instrument de recherche ou d’effectuer des requêtes.

De ce fait, produire des instruments de recherche sur plusieurs supports constitue un bon moyen de toucher un panel plus large d’usagers. Ainsi l’état des fonds des archives de la Fondation Maison des sciences de l’homme, déjà accessible en ligne, sera prochainement consultable dans sa version papier en salle de lecture de la bibliothèque. D’autres instruments de recherche devront le rejoindre au fur et à mesure de l’avancée des travaux de traitement des fonds.

Publier Caderousse
Part II. L’aventure de Caderousse

Comme beaucoup de services d’archives sans doute parmi ceux qui attachent de la valeur à la fonction classement, les archives départementales de Vaucluse souhaitaient disposer d’un outil de mise en valeur de leurs travaux. Le classement est parfois – souvent – l’aboutissement d’années de labeur et de recherches. C’est donc une petite fête lorsqu’un nouveau « bébé » est prêt !

En l’occurrence, il s’agissait là de faire aboutir le travail de tri et de description réalisé par Martine Sainte-Marie, qui avait relevé le défi (sorte de bizutage puisqu’il s’agissait de son cadeau de bienvenue à son arrivée aux archives départementales de Vaucluse en 2006) de classer l’imposant fonds du duché de Caderousse, entré en 1900 et qui avait attendu la bagatelle de 106 années avant de passer entre des mains expertes capables de le maîtriser et d’en venir à bout en douceur. L’inventaire était terminé, avait reçu le visa scientifique et technique des Archives de France, mais comment montrer ce travail ? En publiant un inventaire, évidemment. Oui, mais plus facile à dire qu’à faire quand un service ne dispose ni de cellule PAO, ni de moyens budgétaires suffisants pour financer les prestations d’un graphiste à chaque publication… L’idée a donc germé, avec la complicité d’Anaphore, de développer un outil d’« éditorialisation » pour – enfin ! – publier des inventaires esthétiques directement à partir de la base de données présente dans le module Aide au classement d’Arkhéïa.

La commande était de publier un répertoire en version imprimable d’une part et sous forme de page HTML diffusable sur internet d’autre part, en même temps qu’en version EAD « traditionnelle », sans avoir à retravailler le fichier initial. Les archives souhaitaient qu’une grande attention soit portée à la lisibilité et à la qualité graphique de l’instrument de recherche pour les deux formes de restitution.
Toujours à l’écoute, Anaphore a répondu à nos requêtes et a pu formaliser nos souhaits qui devaient être absolument pris en compte dans une maquette.

Les trois points pris en compte par la maquette proposée

Compréhensibilité

Un instrument de recherche n’est pas toujours d’une grande limpidité. Plusieurs sortes de métadonnées descriptives peuvent être présentées à la suite, sans ou avec des différences typographiques, mais, dans tous les cas, sans qu’il soit possible d’en saisir la nature.

Lisibilité

Cette notion, tout en étant proche de la précédente, peut en être distincte. En effet, la lisibilité facilite généralement la compréhension. Par exemple, une énumération sera nettement plus lisible et donc plus rapidement compréhensible sous forme de liste à puces que sous la forme d’un gros paragraphe avec des points virgules ou des virgules comme séparateurs ; mais le gros paragraphe peut être compréhensible par un lecteur qui s’en donnera la peine si l’archiviste a pris la précaution de préciser de quoi il s’agit, alors qu’une liste sera difficilement compréhensible si l’on ne sait pas de quoi il s’agit.

Esthétique

Si la présentation est soignée, agréable, le lecteur sera plus enclin à consulter l’instrument de recherche. Là encore, cette notion est distincte des précédentes : un instrument de recherche peut être agréable à regarder mais difficile à comprendre. L’intégration de l’iconographie tout au long du corps de l’inventaire s’est imposée.

L’éditorialisation

Elle devait permettre d’intégrer toutes les parties rédigées jusque-là autour de l’inventaire : introduction, bibliographe, sources complémentaires, annexes (généalogie de la famille, glossaire, etc.).

Elle devait également mettre en valeur :

  •   d’une part la structure de l’inventaire (son plan),
  •   d’autre part, le début de chaque nouvelle notice descriptive.

Structure de l’inventaire

Cette structure est plus ou moins complexe ; elle peut compter jusqu’à sept niveaux emboîtés. La base Caderousse joue sur six niveaux. Les archives souhaitaient qu’on puisse toujours savoir où on se situe dans ce plan, quel que soit l’endroit où on se trouve positionné dans l’inventaire.

Notices descriptives

La notice descriptive regroupe deux types de données :

  •   la description de l’unité archivistique elle-même, qui est la description « principale »,
  •   les données complémentaires.

La description principale comprend cinq zones descriptives au maximum :

  • Intitulé
  • Dates extrêmes
  • Présentation du contenu
  • Langue
  • Description physique
  • Cote

Dans ce groupe, les informations saillantes, c’est-à-dire celles qui doivent être facilement repérables par l’œil, sont l’intitulé et les dates extrêmes.
Remarque : traditionnellement, c’est la cote, positionnée dans la marge à gauche, qui sert de repère visuel. Or, cette information est secondaire dans la description. Il serait donc préférable de trouver un autre repère visuel, autour de l’intitulé et des dates extrêmes de l’unité décrite.

Photo

Un outil pour tous les utilisateurs d’Arkhéïa Aide au classement

Photo
 
 
 

Toute cette énergie et plusieurs mois d’échanges ont donc abouti à la création d’un prototype Caderousse. Ce prototype a permis de développer et tester en conditions réelles un outil disponible pour tous les utilisateurs du module Arkhéïa Aide au classement.

Toutes les données sont intégrées dans la base de données et un export, (presque) aussi simple que l’export HTML, permet d’obtenir un objet éditorial soigné, livrable à l’imprimeur en fichier pdf.

Si la partie intégration des images est encore assez expérimentale, il est désormais enfantin de fabriquer un fichier maquetté, compréhensible, lisible et esthétique pour nos lecteurs.

À vous de jouer !

Plan du château ducal de Caderousse, XVIIIe s. - Arch. dép. Vaucluse, 2E9/1225

Publier Caderousse
Part I. Faut-il encore imprimer ?

A l’heure où la présence des services d’archives sur le Web s’impose de façon impérative, comme je l’ai affirmé dans un texte précédent, la salle des inventaires virtuelle est une occasion idéale pour les archivistes de réaffirmer, en utilisant toutes les ressources offertes par la maîtrise raisonnée des nouvelles technologies, la valeur, l’actualité et la pertinence de leurs compétences scientifiques et de leur rôle de médiateurs, qui rédigent et publient des instruments de recherche en ligne.
Cette action, fondamentale pour diffuser la connaissance des fonds, est loin de vider les salles de lecture, comme on le dit parfois. Bien au contraire, en proposant aux chercheurs des espaces d’orientation en ligne de plus en plus riches, l’archiviste met en branle un mécanisme propre à l’incitation à la venue dans les services d’archives, car l’utopie du « un jour toutes les archives seront en ligne » se démonte d’autant plus aisément que les inventaires des sources disponibles montrent leur importance matérielle et leur diversité.

Publier aujourd’hui ? un archaïsme ou un enjeu ?

Mais, de ce fait, la publication traditionnelle des outils d’accès aux documents reste-t-elle un sujet d’actualité ? Est-il aujourd’hui raisonnable d’investir sur la réalisation de répertoires et catalogues imprimés, quand l’accès aux données connaît un essor si considérable ? Ne serait-il même pas abusif, en termes de temps de travail comme en termes de financement, de concevoir des ouvrages en papier pour reproduire à l’identique ce que tout un chacun trouverait sur le net et pourrait imprimer à loisir ?
J’ai la faiblesse de penser que non…

De la nature des instruments de recherche

Car, de même que la « médiation » personnelle, l’accueil en salle du chercheur par l’archiviste est directe et résout nombre de difficultés, ce que l’approche solitaire de la machine permet difficilement, de même instrument de recherche imprimé et instrument de recherche électronique ne sont pas de nature identique et ne connaissent pas le même usage.
L’un est destiné à servir de référence pérenne, l’autre est modifiable dans sa forme comme dans son contenu ; le premier, destiné à la lecture sereine, est fort de ses annexes longues et complètes (introduction historique, bibliographie exhaustive, sources complémentaires détaillées), le second, destiné à la recherche rapide, va s’enrichir de possibilités de rebonds vers d’autres ressources similaires, parallèles, liées hiérarchiquement ou non ; le document papier se feuillette, se parcourt, donne accès aux documents originaux, le document informatique s’interroge, par mots-clés, par facettes ou par type de données, met en évidence les occurrences des mots et des notions, se copie, se diffuse par morceaux, se réutilise…

 

photo

Investiture de portion du péage à sel de Caderousse, 1127 – Arch. dép. Vaucluse, 2E9/506

Imprimer ? quelle gageure !

Mais à l’aune des restrictions budgétaires et du plein emploi des ressources humaines des services capables de s’atteler à une entreprise telle que la publication d’un inventaire traditionnel, et à l’heure où plus aucun ouvrage qui se veut consulté (ne parlons même pas de vente !) ne peut se dispenser d’une riche illustration en quadrichromie et d’une tenue éditoriale impeccable, imprimer un instrument de recherche est un défi redoutable à relever. Qui ne s’est pas arraché les cheveux en relisant pour la quatrième fois les épreuves d’un répertoire numérique avec cinq ou six niveaux de descriptions, que le graphiste de l’imprimerie n’a pas pu correctement identifier et qui se baladent plus ou moins près des marges de gauche, avec des cotes qui viennent mordre l’espace vital de l’analyse, des dates qui s’alignent ou ne s’alignent plus, une table des matières qui a « mangé » un niveau, un titre « veuf et orphelin » !
L’entreprise est d’autant plus risquée qu’elle ne dispense pas de la mise en ligne elle-même de l’instrument de recherche, pour toutes les raisons évoquées plus haut, mais que jusqu’à présent, il n’existait guère de moyen de publier de façon complètement satisfaisante le même objet de base, sans le retravailler entièrement, sur deux supports aussi différents que le Web et le papier, sauf à faire une simple copie pdf de l’imprimé, ou à rebours une sortie médiocre du document html… le tout sans oublier l’instrument de recherche publié en EAD, cherchable et navigable !

Le choix des archives départementales de Vaucluse

Car l’objectif que nous nous sommes fixé aux archives départementales de Vaucluse est celui de produire désormais inventaires et répertoires exclusivement à partir d’Arkhéïa Aide au classement, et de ne mettre en ligne que des fichiers EAD issus des bases générées pour la gestion des descriptions d’archives – même si aujourd’hui la perspective du Web sémantique nous séduit complètement pour la mise en ligne des données.
Mais l’EAD, même transformé à la volée en pages html, n’a rien de très sexy, on en conviendra !
Et lorsqu’un aussi beau fonds que le fonds du duché de Caderousse parvient au terme de son classement, qu’il a fait l’objet d’une telle précision dans ses analyses qu’elles en deviennent articles d’inventaire « à l’ancienne » malgré leurs balises contemporaines rigoureusement normalisées, eh bien tout archiviste normalement constitué a envie qu’il soit valorisé par une publication de qualité et que celle-ci arrive entre les mains de ceux qui sauront apprécier sa richesse et venir exploiter ses ressources.

photo

Plan géométral des terres et îles de M. et Mme de Gramont, an XII – Arch. dép. Vaucluse, 2E9/319

Objectif Caderousse : demander la lune ?

Alors l’objectif pour Caderousse est devenu simple, et compliqué à la fois : il fallait obtenir, à partir d’un outil unique de description conçu dans Arkhéïa Aide au classement, selon la charte de réalisation du corpus des instruments de recherche en ligne du site des archives départementales de Vaucluse :

  •   une publication sur ce site, par l’intermédiaire de Pleade, de l’inventaire encodé en EAD ;
  •   une édition traditionnelle soignée, imprimée et diffusée gratuitement auprès d’un nombre important d’institutions françaises et étrangères, universités et centres de recherche spécialisés comme bibliothèques d’études en sus du réseau « réglementaire » français de distribution des instruments de recherche ;
  •   une possible impression à l’identique à partir d’une imprimante standard ;
  •   et, pour faire simple, l’exemple d’autres départements comme le Tarn aidant, une version Web / html élégante et téléchargeable sur le site des AD.

Le tout avec des caractéristiques propres à chaque publication, sans qu’il soit besoin de reprendre chacune d’entre elles individuellement en cas de modification des contenus, cela va sans dire.

Une nouvelle révolution arkhéïenne ?

D’aucuns (lui le premier, mais il s’en repent !) ont prétendu qu’à une certaine époque, le concepteur d’Arkhéïa s’était mis en tête que l’édition papier des inventaires n’avait plus d’avenir et que seul l’instrument de recherche électronique normalisé sauverait l’archivistique, la vraie, contre les assauts des techniques documentaires.
J’ai dû arriver dans le monde arkhéïen bien après (sourire) ces errances (re-sourire) ou bien alors n’ai-je jamais voulu les entendre – et j’ai bien agi, j’ai eu raison de faire confiance et de ne pas douter que Louis Colombani comprenait en fait parfaitement l’enjeu de « l’éditorialisation » de nos instruments de recherche : un ouvrage publié est une pièce précieuse dans la construction d’une politique de service tournée vers les publics, et un inventaire d’archives au même titre qu’un catalogue d’exposition du Grand Palais ou que les sommes que représentent les Vocabulaires typologiques de l’Inventaire général.
Aujourd’hui Anaphore a conçu la première partie de l’outil qui nous manquait. Certes l’aventure fut engageante pour les archives de Vaucluse et deux de leurs archivistes, Martine Sainte-Marie bien sûr, et Sophie Izac-Imbert, fraîchement arrivée du Tarn. Mais leurs efforts ont produit leur fruit, et l’inventaire du fonds de Caderousse est sorti des presses depuis quelques semaines, premier-né d’une longue série d’instruments de recherche élégants et lisibles ; depuis janvier 2014, les archivistes du palais des Papes impriment même leurs bordereaux de versement en version éditorialisée !
Et je suis sûre que bien d’autres « issues » d’objets arkhéïens divers et variés pourront être inventées à partir des ressources de la nouvelle version d’Aide au classement, surtout lorsque sera finalisée la production d’un export html lui aussi retravaillé pour une mise en ligne « chic », ce qui ne saurait trop tarder, j’en suis convaincue. Nous avons déjà plein d’idées !

photo

Armoiries de la famille de Gramont, XVIIIe s. – Arch. dép. Vaucluse, 2E9/157

Inventaire des archives de la seigneurie de Caderousse par Jean de Jarlains, 1525. Arch.dép. Vaucluse, 2E9/1

« Il faut mettre en ligne ! »
Les contenus archivistiques en ligne : le travail de l’archiviste (part II)

Questions préalables

  • La recherche en archives est une démarche complexe par nature, car elle aborde un matériau riche et complexe ; hors du domaine des grandes séries répétitives, il est illusoire de croire qu’on peut la simplifier à l’extrême, que l’on peut cerner par un ou deux critères un ensemble gigantesque et varié ; tout un arsenal de guides ou de modules spécialisés sont offerts aux chercheurs sur les sites des grandes institutions qui mettent les instruments de recherche au cœur de leur proposition en ligne. Un bel exemple est donné par le site des Archives nationales australiennes.
  • Quels publics l’archiviste doit-il cibler en mettant en ligne des inventaires d’archives ?
    A priori, les publics chercheurs, quels qu’ils soient, même amateurs ou débutants, mais prêts à entamer une vraie démarche, pas à trouver des réponses toutes faites, même si l’archiviste fait en parallèle des propositions du type « dossiers d’histoire », destinés à un public plus large non chercheur.
  • Comment consulte-t-on en ligne ?
    Ce n’est pas le lieu d’analyser ici ce qui fait l’objet d’études nombreuses, mais c’est bien sûr une question primordiale à se poser avant d’adopter un parti de présentation, un modèle de recherche, un type d’instruments de recherche ; il n’est toutefois pas obligatoire de se conformer aux pratiques majoritaires, mais de les connaître et de les évaluer, pour les retenir si elles sont conformes aux objectifs de mise en ligne, ou les rejeter si elles ne sont pas adaptées à la nature du matériau traité ou au niveau d’information délivré. Il faut néanmoins avoir en tête que l’internaute, impatient d’aller à ce qu’il juge l’essentiel, de poser sa question et d’avoir des réponses, lit très peu les modes d’emploi et autres didacticiels, au grand risque de ne rien trouver dans le cadre d’une recherche non formatée.
  • Met-on les mêmes outils en ligne et en salle de lecture ?
    Non. Ni dans leur nombre et diversité, ni dans leur forme.

    • En salle, le recours à l’archiviste est direct et résout nombre de difficultés, ce que l’approche solitaire de la machine ne permet que difficilement ;
    • L’informatique supporte très mal l’approximatif des instruments de recherche provisoires ou anciens, pourtant fort précieux pour le chercheur ;
    • Recherche en ligne et recherche en salle ne sont pas équivalentes, et ont besoin d’outils différents ;
    • Tout contenu d’instrument de recherche n’est pas publiable en ligne.
  • Comment gérer les « retours » de l’interactivité entre public et recherche en ligne ?
    L’internaute est beaucoup plus exigeant, plus critique et plus réactif que le lecteur traditionnel. Son utilisation des outils mis en ligne n’est en outre jamais tout à fait ce que l’archiviste avait prévu ; à l’archiviste d’évaluer les critiques formulées, soit pour les prendre en compte et adapter les outils, soit pour user de plus de pédagogie en ligne et mieux expliciter la démarche et les objectifs atteignables grâce aux outils.

La présentation des fonds et des instruments de recherche

L’organisation des sites d’archives est significative de ce que l’archiviste veut porter comme message et des priorités qu’il attribue à chacun des modules qu’il propose à l’internaute.

La structuration de la présentation des fonds

C’est une vraie démarche archivistique de présenter les fonds conservés par l’institution, dans lesquels les recherches s’effectueront, soit en ligne, soit en salle.
Sa raison d’être est d’aider l’internaute à connaître le contexte général de production des archives qu’il va pouvoir consulter et à mieux cerner ce qu’il peut y trouver, donc y chercher. Les systèmes nationaux de collecte et de conservation, les histoires archivistiques des pays, conditionnent la plupart du temps cette présentation, organisée simplement (ordre alphabétique du nom des fonds par exemple pour les archives italiennes) ou structurée, de façon chronologique (fonds coloniaux / fonds après l’indépendance au Sénégal, fonds d’Ancien Régime / fonds postérieurs à la Révolution en France), selon la nature des fonds (fonds notariaux, fonds administratifs…), selon les niveaux hiérarchiques des producteurs (organisations gouvernementales, agences locales), selon des thématiques (archives militaires, archives de l’immigration)…
En France, ce sont des cadres de classement réglementaires qui sont généralement utilisés, subdivisés en « séries », identifiées par des lettres et regroupant des fonds de même type de provenance (fonds judiciaires d’ancien régime, fonds d’institutions religieuses régulières, fonds d’origine privée…) ; extrêmement « pratique » car référentiel uniforme partout en France, le cadre de classement départemental est cependant un système faussement respectueux des fonds, qu’il va éclater entre diverses périodes, regrouper artificiellement, ou scinder en plusieurs thématiques.

L’organisation des instruments de recherche

L’organisation des instruments de recherche, indépendamment de leur nature et de leur forme, est de même un choix archivistique fondé sur les sources mais aussi sur les méthodes de recherche proposées, ou les sujets priorisés :

  • Elle peut suivre la même structuration que la présentation des fonds, par série du cadre de classement, ou au contraire par type de fonds ;

Capture d'écran État général des fonds - Archives de Vaucluse

  • Elle peut être organisée de façon plus pragmatique, indépendamment de la présentation globale des fonds, en fonction de sujets pertinents entre eux : les outils pour effectuer une recherche sur l’histoire des familles, les guides des sources de l’histoire de la première guerre mondiale ou de l’immigration…

La mise en forme des instruments de recherche

La façon dont l’internaute pourra appréhender l’instrument de recherche qui répondra à sa requête dépend aussi de choix archivistiques majeurs :

  • L’archiviste peut choisir de n’offrir qu’une référence précise, hors contexte ; la description de l’article ou des articles qui répond(ent) à une recherche simple dans des documents sériels, et qui vont mener parfois à l’image des documents eux-mêmes : le plan cadastral de la commune de R ou les baptêmes de 1754 du village de Saint-Martin.
  • Il peut choisir cette solution également dans une recherche plus complexe, dans une réponse de type documentaire.
  • Une réponse de type archivistique mettra, elle, le document identifié en relation avec son contexte, dans le cadre d’une description hiérarchisée conforme à l’ISAD(G).
  • Le parti peut également être d’offrir systématiquement au chercheur un instrument de recherche lisible de son début à sa fin, soit sous forme traditionnelle (reproduction sous format pdf d’un instrument de recherche papier) soit sous forme « navigable », où chaque niveau se déplie.

L’interrogation des instruments de recherche

    Photo

    • L’accès aux archives
      • Mettre les archives à la disposition du public, mission ultime de l’existence de l’archiviste, ne veut pas dire laisser le chercheur essayer de trouver lui-même dans les magasins de stockage un item choisi au hasard, sur son simple titre aperçu au passage. Mettre à disposition virtuellement repose sur le même principe : comme lors de l’accueil physique du lecteur, que l’archiviste écoute et oriente, la mission de l’archiviste n’est pas de laisser l’internaute se débrouiller tout seul face à des milliers d’images ou de références, mais bien d’être un médiateur entre le document d’archives et l’utilisateur, grâce à son expertise, sans céder aux fallacieux arguments qui prétendent que son travail propre peut être remplacé par un moteur de recherche performant.
      • Servir de médiateur ne veut pas dire faire le travail du chercheur, mais lui donner des outils d’accès, en fonction de sa demande, de son attente, de ses compétences également ; percevoir quel niveau d’information apporter est primordial : on ne répond pas de la même façon à un généalogiste amateur débutant et à un historien professionnel habitué à la fréquentation scientifique des documents. Il est donc nécessaire de proposer plusieurs niveaux de recherche, et des parcours différents adaptés aux intérêts des différentes catégories de publics visés. Il est également fondamental de concevoir simultanément l’instrument de recherche et son outil d’interrogation, adapté au contenu des descriptions.
    • L’archiviste ne travaille plus pour une communauté restreinte se déplaçant vers lui et partageant avec lui un mode consensuel d’échange, mais s’adresse à travers la mise en ligne à des internautes du monde entier, avec lesquels il lui faut trouver un langage commun dépassant les usages particuliers, normalisé et structuré.
    • Parallèlement, de nouveaux modes d’interrogation, de nouvelles façons de concevoir la relation des objets entre eux, de nouvelles approches des contenus sont en plein développement sur la toile. Les archives ne doivent pas rater leur entrée dans le monde du web des données, et ne pourront rester figées dans des schémas dont l’insuffisance commence à se faire sentir : le web sémantique est la porte d’accès à un vrai réseau culturel et patrimonial dont il serait inconcevable que les archives soient absentes. Il convient donc à nouveau que l’archiviste réévalue ses outils de mise en ligne, mais qu’il garde toujours la même ligne de mire : l’instrument de recherche est l’outil d’accès aux archives, il se décline seulement selon les supports.
    Projet de pont « ridicule » sur l’Aigues – avant 1840. Arch. dép. Vaucluse, 3S40

    « Il faut mettre en ligne ! »
    Les archives, les archivistes et le Web (part I)

    Le constat n’est plus à faire, la mise en ligne « des archives » est devenu un impératif professionnel de première urgence.
    Mais pourquoi donc cette urgence ?

    •   une forte pression « sociétale » réclame de pouvoir disposer d’informations à satiété sur l’histoire personnelle des individus, en même temps qu’elle refuse de considérer désormais l’existence ou la validité de ce qui n’est pas en ligne, et interpelle les pouvoirs publics pour accélérer cette nouvelle « sociabilité du bout des doigts »…
    •   les gouvernements s’en mêlent en prônant le tout numérique et la diffusion des informations publiques sur les réseaux, pour l’accessibilité citoyenne au patrimoine.

    En écho à cette exigence sociale, les services publics d’archives, à l’instar d’ailleurs des autres institutions patrimoniales, ont donc entrepris des démarches variées de mise en ligne, devenue véritable objet stratégique dans leur politique.
    L’archiviste doit désormais concevoir la mise en ligne non comme un « extra », mais comme une dimension actuelle de son métier, en liens étroits avec toutes ses missions de collecte, de classement, de conservation, de communication et de valorisation.
    C’est même l’occasion pour lui de revenir sur le cœur de sa compétence ; l’archiviste doit s’emparer des nouvelles technologies de communication, et les utiliser pour développer les principes et gestes fondamentaux de l’archivistique, avec toutes leurs exigences scientifiques ; ainsi il affirmera sur le Web à la fois l’identité des archives comme matériau unique, proche mais différent de celui des bibliothèques ou des centres de documentation, et l’identité de son métier d’archiviste : il n’est pas un pourvoyeur d’informations tout à fait comme les autres, mais il a pour spécialité de décrire les fonds afin de les mettre à disposition de façon durable.

    Que mettent en ligne les archivistes ?

    Des images et des contenus

    Dans un monde où l’œil est roi, on trouve énormément d’images sur les sites d’archives :

    •   documents offerts à la consultation : ce sont par exemple les collections de sources d’histoire des familles ;
    •   documents figurés donnés à voir, pièces d’archives comme plans de bâtiments, de territoires et de villes, à l’instar de cette représentation de la tour Anglica de Barbentane dans un recueil de comptes de l’évêché d’Avignon de 1363-1366  ou collections iconographiques comme cartes postales et photographies ;
    •   « trésors » d’archives, pièces exceptionnelles, comme ces deux épisodes de la chanson de Roland en provençal trouvés en tête d’un registre de notaire d’Apt du XIVe siècle
      ou symboliques par leur historicité ou leur beauté.

    L’accès à ces images est multiforme : bases de données pour les grandes séries, expositions virtuelles, « galeries » de documents, dossiers pédagogiques…
    On trouve également beaucoup de contenus de séries homogènes de documents primaires, dépouillés et mis à disposition généralement sous forme de bases de données interrogeables, nominatives ou géographiques : matricules militaires des soldats de la guerre de 14-18, dossiers d’immigrants sur le site des Archives nationales d’Australie, liste d’arrivants aux États-Unis sur Ellis Island Online, avec souvent des liens vers des images, de dossiers, de bateaux, de photographies personnelles ou de groupes…
    Cette politique répond à une demande très forte, d’ancrage dans la société, de recherche de racines, d’histoire personnelle et familiale, de repères locaux, d’identité en somme, à laquelle l’archiviste se soustrait très difficilement ; ces dernières années, il était quasi suicidaire en France pour un service départemental de ne pas avoir mis en ligne l’état civil !

    Des enjeux stratégiques

    En termes d’analyse de son métier, l’archiviste peut se dire à juste titre dans ce type de mise en ligne qu’il assure plusieurs de ses missions : outre la réponse aux besoins des usagers, il apporte une vraie plus-value à son rôle de passeur

    •   en mettant des documents à disposition sur une très grande échelle,
    •   tout en assurant une préservation efficace des originaux ; ces documents seraient sans cela les plus fragilisés de tous, car les plus consultés ;
    •   attirant des publics « captifs », il en profite d’ailleurs pour leur proposer d’autres ressources, moins attendues, qu’ils n’auraient pas découvertes par eux-mêmes.

    Par ce biais de sa connaissance inégalée des fonds, de même que par l’ampleur et la diversité des collections qu’il gère et peut mettre en ligne sous forme numérisée, l’archiviste affirme l’essentialité de son rôle face à la demande de masse.

    Pour aller plus loin dans la réflexion, on peut toutefois s’interroger sur le niveau archivistique de ces mises en ligne d’images numériques, qui restent souvent très « basiques », tant du point de vue de la description que de l’organisation des documents : les objets présentés sont soit très sériels et répétitifs, sans nécessité d’analyse fine, soit au contraire traités à l’unité comme issus d’une collection.
    C’est là que se situent les limites de l’exercice : la quasi obligation de mettre en ligne des quantités considérables de documents sériels, représentant en réalité une infime quantité des fonds conservés, destinée essentiellement à un public très identifié et à un certain type de recherche qualitativement limitée, ne doit pas faire oublier à l’archiviste que la mission où il est irremplaçable n’est pas celle-là : le cœur de son métier, c’est la mise à disposition de tous les publics de l’ensemble des archives qu’il conserve, c’est la présentation des fonds, c’est leur classement et surtout leur description ; la mission et l’expertise de l’archiviste, c’est la constitution des instruments de recherche, seul moyen d’accès véritable à la documentation historique de la recherche. Et c’est dans cette mise en ligne-là que sont les vrais enjeux stratégiques pour les archivistes.

    Réservistes de 1870, hôtel des Invalides, Paris. Pierre Georges Jeanniot. Wikipedia

    Préparation de la mise en ligne des registres de recrutement militaire

    Les registres de recrutement militaire

    Voici une présentation rapide des registres de recrutement, dits registres matricules, faite à partir d’extraits de la page du service historique de la Défense.

    Depuis le début du 19ème siècle, tout Français de sexe masculin a été inscrit sur au moins un tableau de recensement.
    [...]

    Les premiers registres matricules apparaissent en 1859, mais les séries sont continues à partir de 1867. Ces documents sont établis par les bureaux de recrutement, dont le ressort peut englober des cantons situés dans des départements limitrophes ; ils sont composés d’une succession de fiches individuelles, qui fournissent les renseignements suivants :
    • nom, prénom, état civil détaillé ;
    • signalement (couleur des cheveux et des yeux, forme du front, du nez et du visage, taille, marques particulières) ;
    • renseignements divers sur les qualités, diplômes et aptitudes de l’individu ;
    • degré d’instruction ;
    • observations : on indique dans cette case si l’inscrit est soutien de famille, s’il demande un sursis d’incorporation, s’il est fils d’étranger, naturalisé, réintégré, etc. Sont également précisés les changements de résidence et l’adresse précise de l’individu, ou encore les maladies dont il souffre.
    [...]

    À partir de 1905 et la fin du tirage au sort, tout individu de sexe masculin doit se faire recenser auprès du bureau de recrutement (appelé ensuite bureau du service national) dont relève son domicile. Il entre alors dans une classe, dont le numéro correspond à l’année de ses vingt ans […] et se voit attribuer un numéro de matricule et un dossier. Ces dossiers, regroupés en registres matricules, sont conservés par le bureau du service national…

    On pourra aussi consulter le billet Tour de France des matricules sur le blog « Sources de la Grande Guerre ».

    La mise en ligne des registres matricules

    Ces documents constituent une source privilégiée pour les généalogistes en ce qu’ils permettent d’accéder à une description assez détaillée des conscrits. Ils peuvent également constituer une source statistique et démographique.
    Un certain nombre de services d’archives départementales ont mis en ligne leurs registres matricules. Cette mise en ligne peut se faire suivant plusieurs niveaux de précision.

    •   Seulement les tables alphabétiques des noms.
    •   Avec les registres eux-mêmes.
    •   Avec indexation nominative des conscrits.

    Une carte de France régulièrement tenue à jour de ces mises en ligne est visible sur le blog de La Revue française de Généalogie.

    Le centenaire de la Grande Guerre a accéléré le mouvement de mise en ligne et le ministère de la culture l’a encouragée. Dans cet objectif, les ministères de la culture et de la défense ont saisi la CNIL pour qu’elle autorise la mise en ligne des registres jusqu’en 1921. Voir, par exemple sur le site GénéInfos, et la délibération de la CNIL n° 2013-281 du 10 octobre 2013.

    Le portail Généalogie

    Présentation

    Précisons que ce portail ne concerne pas que les registres matricules mais, comme son nom l’indique, des sources pour la généalogie.
    Le projet a été lancé en 2008. On pourra trouver une présentation sur le blog « Comité d’Histoire du Haut-Pays ».

    Un moteur très puissant permet de faire des recherches sur les noms et prénoms et de filtrer ensuite, si nécessaire, les réponses à l’aide de facettes : précision du nom, pays ou département, dates, types de documents, bases de données (origine des descriptions).
    Les résultats apparaissent sous la forme d’une liste avec les colonnes : nom, prénom, date, lieu, type de document. Quand il existe un document numérique, une icône sert de lien vers le document ou sa description sur le site du service qui le conserve.
    Ci-dessous une illustration d’un extrait de réponses à une requête.

    Portail Généalogie - extrait de réponses à une requête

    Quelques éléments techniques

    Le ministère de la culture, service interministériel des Archives de France, a élaboré un « modèle de données normalisé de données généalogiques (Nomina) » et un schéma XML de même nom.
    Ci-dessous, une illustration de ce modèle extraite du document « Moteur « Généalogie » : questionnaire de paramétrage technique ».

    Photo

    L’indexation des registres matricules

    Le service interministériel des Archives de France a rédigé un modèle de cahier des charges type pour la numérisation des registres de matricules militaires.

    Bien que cela ne soit pas son objectif principal, ce document donne, en annexe, des recommandations pour une « prestation d’indexation nominative ». Il précise les problèmes posés par cette indexation nominative (coût, qualité des prestations, questions juridiques – le document est antérieur à la délibération de la CNIL n° 2013-281 du 10 octobre 2013). Il propose, pour les cas d’indexations les plus fines, un tableau avec les éléments ci-dessous :

    •   Cote
    •   Classe
    •   N° matricule
    •   Bureau
    •   Nom
    •   Prénoms
    •   Année de naissance
    •   Département de naissance
    •   Localité de naissance
    •   Département de domiciliation lors de l’enregistrement
    •   Localité de domiciliation lors de l’enregistrement
    •   Premier identifiant d’image
    •   Dernier identifiant d’image

    Le travail d’Anaphore

    Actuellement, deux services d’archives départementales ont demandé l’assistance d’Anaphore pour la préparation et la réalisation de la mise en ligne de leurs registres matricules en lien avec le portail Généalogie.
    Nous vous tiendrons informés de l’avancement de ce chantier qui est, d’ores et déjà, bien engagé.

    Si d’autres services sont intéressés, ils peuvent, bien entendu, nous contacter et nous pourrons échanger sur le sujet.