Guide pratique de relevé d'un registre paroissial par dictée vocale

De Geneawiki
Aller à la navigation Aller à la recherche

Les registres paroissiaux, un gisement de trésors enfouis

Les registres paroissiaux du XVIIe siècle sont souvent très laconiques : Date et lieu de naissance, nom des parents et des parrains pour un baptême, nom des époux pour un mariage, parfois leurs parents. Il faudra attendre le XVIIIe siècle pour connaître l’âge des mariés et d’autres informations.

La généalogie se résume-t-elle à ces quelques données essentielles ? On peut le penser en consultant des banques de données généalogiques. Ces banques permettent d’accumuler et de pérenniser les données généalogiques, mais elles ont une certaine rigidité, elle ont besoin d’une structure établie et seules les données prévues peuvent y entrer. Le résultat est un accroissement quantitatif doublé d’un appauvrissement qualitatif par rapport aux manuscrits. Elles ont un défaut, un certain nombre d’informations s’y perdent, simplement parce qu’on ne sait pas les retrouver. Mais ce sont des mines d’or et un point de départ pour les généalogistes.

Il faut nourrir les banques avec des données qu’elles comprennent. Seuls des tableurs et des programmes spécifiques peuvent générer des fichiers utilisables pour des banques de données. La page Saisir un dépouillement systématique en donne un aperçu dans notre geneawiki.

Les généalogistes ont compris depuis longtemps l’intérêt de collaborer et de mutualiser leurs données. Ils se sont regroupés en clubs et ont fait des relevés d'abord manuscrits, puis tapés à la machine. Avec l’apparition de la micro informatique, c’est au clavier qu’ils ont entré les données, un travail de titan que nous devons saluer. Grâce à eux, il est devenu aisé de naviguer dans nos arbres généalogiques. A nous de continuer ce travail pour les généalogistes qui nous suivront, et avec les outils de notre siècle. Faire un relevé complet de registre, et il en reste à faire, produit une grande quantité de données. C’est une chance pour le transcripteur, mais aussi pour l’association qui les mettra en ligne, et a tentation est grande de les explorer. Je souhaite aussi que les associations qui détiennent des relevés les explorent, il y a certainement des choses à trouver dedans, cela peut réserver des surprises et éclairer certains aspects de la vie de nos ancêtres.


Revenons au XVII siècle. Dans une petite ville de la Somme, les registres de baptême, les seuls à avoir survécu de cette époque, sont un peu plus plus diserts. Plusieurs parrains et marraines sont cités et hiérarchisés dans les actes. Ce n’est pas sans évoquer le conte de Grimm “La belle au bois dormant”, un de ces contes qui ont été collectés au début du XIXe siècle, et qui rapportent une tradition orale qui se perd dans la nuit des temps. Ici, à Saint-Valery-sur-Somme, plusieurs personnes se penchent sur le berceau du nouveau né. Pourquoi tant de parrains, les quels sont de la famille, à quels cercles d’influence appartiennent-ils, pourquoi ont-ils été sollicités ? Voilà bien des mystères qui s’étalent devant nos yeux, quel sens leur donner ? Brusquement, en août 1648, ils sont réduits à un seul parrain et une seule marraine par baptême … Un décret ? Déjà dans ces registres anciens, la qualité des personnes citées apparaît souvent, et cela durera pendant tout l’ancien régime. On croise, des “Maître, damoiselle, discrète personne, honorable homme”, etc ... Autant d’individus qui ont un statut social, parfois une noblesse, “Escuyer sieur de ...”.

Plus tard, au XVIIIe siècle, les mariages s’étoffent et deviennent filiatifs, mais l’information généalogique se dilue. Ils se remplissent de justification religieuses, de la dénomination du curé ou du vicaire qui officie voire d’un prêtre venu d’ailleurs qui a obtenu la permission de célébrer (un parent de l’un des époux ?), de ceux qui certifient les bans, de la description de tout le cérémonial, des bans aux fiançailles, jusqu’aux témoins… Si les bans nous révèlent un peu de l’origine des mariés, les dispenses peuvent avoir un sens social, car elles sont obtenues à titre onéreux, à de très rares exception près. Dispenses ? Oui, il faut publier trois bans à des messes de dimanches et fêtes consécutifs avant un mariage pour que la rumeur publique puisse faire remonter une opposition. Si le premier est toujours annoncé, on peut se procurer à l’évêché du diocèse, une dispense des deux suivants, et pas pour des raisons d’urgence. Pour des questions de dogme, on ne doit pas se marier en temps d’avent ou de carême ! Mais que si, avec une dispense. Attention à la consanguinité, le bon sens la déconseille, la morale l’interdit … l’évêque le permet, au moins pour les 3e et 4e degrés. Dans le cas d'un 2nd degré de consanguinité, il y a des milieux où on se marie entre soi, on demande l’approbation directement au saint-siège de Rome. Dans ces actes de mariage, on trouve pèle mêle des interdictions parentales et leur levée par acte notarial, des curateurs, et parfois des foules de détails qui nous ouvrent une fenêtre sur la vie de nos ancêtres. Cela vaut la peine d'y prêter attention.


A partir de la révolution et l'instauration de l'état civil, la dilution des informations s'accroit et elles deviennent redondantes, il n'est pas rare de trouver mention du mariage des parents dans un acte de naissance, un acte de mariage peut receler l'état civil de deux, parfois trois générations, et la lecture complète d'un registre demandera beaucoup plus de travail pour un résultat moindre. Il vaut mieux en tirer un résumé, car la méthode décrite ici est moins bien adaptée dans cas.


En recelant les seules données généalogiques usuelles, les banques de données nous privent de tous ces indices qui donnent de la consistance à la vie de nos ancêtres et dont nous ne soupçonnons pas l’existence. Elles conservent la fleur et le fruit, mais les feuilles, les tiges et les racines qui dorment dans le manuscrit ne sont pas remontées jusqu’à elles. Les registres regorgent de ces informations discrètes, qui nous passent sous les yeux lorsque nous les parcourons. C’est leur lecture qui nous fait prendre conscience de leur intérêt, de ce que nous ne cherchons pas, et que nous découvrons par hasard. Cette lecture peut être rapide, mais la dactylographie en est dissuasive. Devons nous renoncer à cette masse d’information ? Plus maintenant, un simple téléphone portable va nous permettre de les prendre en compte par un relevé intégral, sans plus d’efforts que la dactylographie des données généalogiques usuelles. Nous allons voir comment.

Le relevé intégral permet d'avoir une vue extensive sur la vie des individus, et même de la paroisse entière, en examinant les données, en les comparant entre elles, mais aussi en les confrontant avec d'autres documents contemporains qu'on peut découvrir dans les réserves des archives départementales.


Pratique du relevé

C'est plutôt la maladresse au clavier et des fautes de frappe incessantes, qui m'ont poussé à développer cette méthode orale rapide. Elle demande un minimum de frappe au clavier, mais augmente le nombre de contrôles qui fiabilisent la saisie. Mais vous trouverez aussi dans ces page quantité de petites informations utiles pour finaliser un relevé par une méthode plus traditionnelle, que je nommerai dactylographique.


Entrouvrons tout d'abord un registre pour regarder ce qu'il contient.

Balisage du registre

Depuis l'origine, les registres contenant les baptêmes, mariages et sépultures, ont été faits en deux exemplaires dont l'un était déposé annuellement au greffe de la région. L'édit de 1736[1][1] réforme la tenue des registres paroissiaux et précise ce qu’ils doivent contenir. Dès lors, ils s’enrichissent d’âges, de professions, de filiations. A partir de 1746[2], les sépultures (S) devront être consignées dans un livret séparé de celui des baptêmes et mariages (BM). Il arrive assez souvent que l'original contenant les signatures reste à l'église et que la version destinée au greffe n'en soit qu'une copie conforme et certifiée, mais pas toujours réalisée au moment des actes, donc non signée, parfois recopiée par une autre personne ou moins complète. La copie est souvent en meilleur état que le registre conservé dans la paroisse, qui a été plus utilisé et peut présenter des marques d'usure qui rendent la lecture plus difficile.

Ces livrets ont souvent été reliés, mais parfois dans un ordre inattendu. Par exemple tel supplément oublié se retrouve en fin de volume, ou encore deux livrets de sépultures se suivent, et donc ensuite deux livrets de BM. D'autres fois, des exemplaires du greffe sont entrecoupés avec ceux qui proviennent de l'église. Les registres en ligne sur les sites des archives, sont des numérisations de microfilms en noir et blanc réalisés antérieurement. Certaines images trop sombres ont été dupliquées avec un réglage qui les rend plus claires. Parfois une prise de vue interrompue avant la fin d'un livret, est refaite entièrement avec un réglage qui rend les images mieux lisibles. Plus rarement, deux pages ont été tournées ensemble et un feuillet manque. Quand c'est possible, il faudra faire un saut en mairie pour photographier dans l'original les pages manquantes dans la numérisation. De leur côté, les archivistes ont segmenté les registres en proposant des blocs d'images, souvent d'une dizaine d'années.

Tout cela justifie de faire un repérage en feuilletant le ou les registres en ligne qu'on souhaite relever. On pourra s'en dispenser lorsque les registres en lignes offrent un accès direct à chaque année et type de livret dans un bloc d'images.

Cela prendra une petite heure de relever les numéros de vue de début et de fin de livret annuel, ainsi que leur type, de vérifier la continuité des numéros de feuillets en haut des pages de droite pour signaler les vues doublées et surtout inventorier les pages manquantes, signaler les doublons de livrets pour éviter une double lecture. On obtient ainsi un schéma de la structure sur lequel on pourra s'appuyer dans le déroulement du relevé.


Méthode de relevé par lecture du manuscrit au téléphone

Cette méthode[3] qui a déjà été décrite sommairement, peut être utilisée pour tous types de manuscrits ou à des imprimés qui résistent aux logiciels de reconnaissance de caractères. Elle convient bien au relevé de registres paroissiaux anciens car ils ont une structure répétitive et une très forte densité d'informations utiles pour la généalogie. De plus les noms cités reviennent plusieurs fois chacun et cela permet d'affiner leur lecture et de les reconnaître.


La méthode par lecture au téléphone comprend trois étapes principales :

  • Lecture rapide de vues du registre dans le but d'accumuler dans un brouillon un très grand nombre de transcriptions d'acte.
  • reprise du brouillon dans un traitement de texte pour corriger le premier jet par une seconde lecture approfondie du registre en ligne, et transfert régulier des pages corrigées vers le fichier final qui contiendra le relevé définitif. Ce texte est transitoire, il se prête mal à l’exploitation des données. Nous les transférerons dans un outil beaucoup plus souple, le tableur.
  • Mise en table des données du texte corrigé par copier/coller dans une feuille de calcul, pour rendre les données exploitables informatiquement. A cette occasion, on fait une relecture complète, cette fois ci de la transcription, l'image étant toujours en regard. Une simple attention flottante permet de débusquer un nom incongru, ou qui sonne mal, permettant une nouvelle épuration des données.

On ajoutera avec profit une quatrième étape de consolidation des données, par des tris sur le tableau.

Les données seront alors prêtes pour une cinquième étape, leur analyse.


Cette méthode est un peu frustrante car on n'en voit pas tout de suite le résultat. Il faut atteindre la troisième étape pour voir se construire le tableau des données. Mais c'est une méthode rapide car la lecture va bien plus vite et permet d'extraire plus d'informations que la dactylographie directe. La multiplication des lectures suivie d'une consolidation des données permet d'obtenir un fichier propre où les possibilités d'erreurs ont été réduites au minimum au fil des lectures successives. On pourra puiser dans le texte intégral, la transcription des actes qui ont une place dans notre généalogie, évitant ainsi de les dactylographier une fois de plus dans notre logiciel de généalogie.

Cette méthode orale sera d'autant plus efficace qu'on aura cumulé la lecture de plusieurs années de registres, voire plusieurs dizaines d'années, conduisant à un fichier qui peut compter jusqu'à plusieurs centaines de pages de texte brut. Pour faire un essai, il est conseillé de traiter au moins une année entière de registre.

Le relevé d'un registre est un travail de longue haleine qui s'étale sur plusieurs mois. La première étape de lecture doit être terminée avant d'entreprendre la seconde, la correction, mais la seconde et la troisième étape peuvent se mener en parallèle et d'une manière discontinue, en fonction du temps disponible. Cette opération peut même être interrompue quelques semaines ou quelques mois. Les données sont toujours là, il faudra peut-être juste un peu de temps pour se réhabituer à l'écriture du manuscrit.


Lecture du manuscrit

L'outil de base est un téléphone mobile équipé du système d'exploitation Androïd[2] de Google. Si le forfait du téléphone est limité en accès internet, on évitera de le faire exploser en désactivant les données cellulaire et en activant la wifi pour se connecter sur la box internet de la maison. Je n'ai pas eu à disposition de téléphone sous iOS[3] pour vérifier ses performances et un timide essai avec le module vocal de windows 10 ne m'a pas convaincu.

Le système Androïd propose en standard un module vocal matérialisé par une petite icone de micro en haut à droite du clavier virtuel qui apparait lorsqu'on veut taper un message. Le logiciel interne de l'appareil est moins performant que celui, externe, sur des serveurs de google, vers lequel il se dirige automatiquement et de manière transparente lorsqu'il est connecté au réseau. L'appareil chargé, le déshabiller de sa coque de protection car la lecture va faire travailler le processeur, chauffer l'appareil et à terme ralentir son activité, voire l'arrêter temporairement. Rien de grave, il suffit de le laisser refroidir quelques minutes pour pouvoir reprendre la main. Pas besoin de le tenir en main, mais plutôt incliné sur un petit support pour que l'air circule autour de lui, et pas trop loin de nous pour qu'il nous entende et qu'on puisse y jeter un œil sans interrompre la lecture.

L'enregistrement consiste à envoyer un courriel dont on va dicter le texte au téléphone. Donc ouvrir son logiciel favori de messagerie, créer un nouveau message, donner l'adresse de destination qui peut être celle de l'utilisateur lui-même, et donner au message un titre contenant une référence au registre à relever et le numéro de la vue du début de la lecture. Passer dans le corps du message, cela déclenche l'apparition du clavier, et toucher l’icône du micro. Il va vous répondre qu'il est prêt par un bip sonore. La lecture doit être rapide sinon le module vocal peut décrocher et nous laisser parler dans le vide. Le logiciel est capable de transcrire très rapidement, mais lorsqu'il chauffe, il ralentit, sans cesser d'interpréter nos paroles tant qu'il en aura à traiter, mais il peut s'interrompre plus ou moins rapidement s'il décèle une pause dans notre flux de paroles, avec une sensibilité qui augmente avec la fièvre de l'appareil. On peut ainsi lire entièrement une, deux, trois vues, ou plus, parfois pendant une heure si le téléphone ne chauffe pas trop. On veillera à interrompre quelques instants la fonction vocale à la fin de la lecture de chaque acte pour insérer quelques retours de chariots entre eux, qui vont aérer le texte. Cela permet aussi de reprendre son souffle, d'explorer rapidement le début de l'acte suivant pour bien commencer la prochaine lecture.

On prendra soin de poser des repères dans le texte à chaque début de page en disant par exemple "Vue 187 page gauche", à la page suivante "Vue 187 page droite feuillet 23" et toujours terminer le message avant de l'envoyer en signalant où on en est, comme "continuer vue 188". Ces balises simples permettront de s'y reconnaître lors de la concaténation les morceaux de texte dans l'étape suivante qui consiste à ouvrir le message envoyé et en copier le texte dans notre traitement de texte favori, LibreOffice[4] ou autre. Ne pas oublier de remettre l'appareil à charger pour la prochaine lecture. Il vaut mieux ne pas recharger pendant la lecture, ce serait une source de chaleur supplémentaire.


Cette étape a pour but d'emmagasiner assez rapidement un maximum de mots, et le débit de parole doit être assez rapide pour que la transcription ne s'arrête pas. Aussi, si un mot pose des difficultés de lecture, on ne s'y attardera pas en disant simplement "à déchiffrer" ou si on a un doute sur ce qu'on a lu, "à relire". Ne pas s'inquiéter si un "Oh la la la, c'est pas ça" nous échappe, ce sont de simples scories qui seront facilement retirées dans l'étape suivante. Il vaut mieux remplir le flux de parole plutôt que de risquer de l'interrompre par une hésitation que le logiciel de la machine aura estimée assez longue pour être un arrêt.

Cette lecture rapide peut être laborieuse au début, tant qu'on n'est pas encore "entré" dans l'écriture du manuscrit. Mais lire tous les mots d'un acte constitue un très bon entrainement, plus on en lit, mieux on le lit. Quoi qu'il en soit, il faudra s'adapter, au fil des années lues, aux changements d'écriture.

On pourra archiver les messages des lectures brutes tant que le texte n'a pas été corrigé de manière à pouvoir y revenir en cas de problème matériel.

Correction du texte

Les morceaux de texte ont donc été accumulés dans un fichier de premier jet ou brouillon, sur lequel on va réaliser la correction. Pour éviter de modifier à nouveau ce qui a déjà été corrigé, il suffira de transférer régulièrement les données, par exemple après la correction de chaque vue, dans un autre fichier que sera le réceptacle définitif de la transcription. Ne pas hésiter à structurer ce fichier en plusieurs sections qui seront titrées et séparées par des sauts de page ou des lignes de pointillés ou d'étoiles.

  • Tout d'abord un en-tête contenant le titre du document, la référence d'archive du registre concerné, un petit paragraphe qui détaille le but du projet et son état d'avancement, c'est utile pour reprendre un projet resté en suspens.
  • La section suivante, contiendra la description de la structure du registre telle qu'elle a été découverte lors de son balisage, s'il y en a eu un.
  • Une autre section pourra servit à établir la liste des annotations en dehors des actes : à telle vue, il y a une annotation qu'on pourra recopier ici ou décrire sommairement. Cela donne une image de la vie propre du registre.
  • Encore une section pour recenser les actes notables, ceux qui sortent de l'ordinaire et méritent qu'on les retrouve facilement pour les communiquer.
  • Enfin, la section majeure sera celle de la transcription définitive dans l'ordre naturel des pages du registre.

Gardons pour principe que ce fichier contient une transcription de manuscrit et que tout ce qui n'appartient pas au texte sera mis entre crochets carrés. Dans un manuscrit de BMS, utilisons ce principe pour différencier les actes en introduisant des mots-clés (mots ou expressions, tags) comme [baptême], [mariage], [inhumation] avant chaque acte pour pouvoir parcourir le fichier par type d'acte. Nous pouvons faire une exception pour les lignes contenant le numéro de vue et de page qui n'appartiennent manifestement pas au corps du manuscrit et qu'on devra laisser en place pour pouvoir naviguer dans le texte et les images du registre.


Le "curseur" est un outil indispensable à mettre en place avant de commencer une correction ou une mise en table. Il convient de pouvoir retrouver l'endroit où on en est en cas de changement dans la fenêtre du texte, ou de reprise du travail après un arrêt de l'ordinateur. On va donc construire un curseur, c'est à dire une ligne de pointillés contenant un mot unique dans le texte comme "correction" ou "mise en table", qu'on déplacera après le traitement de chaque acte vers l'acte suivant et qu'on pourra retrouver par une simple recherche de mot. Il constitue aussi un repère visuel pour porter le regard vers le texte de l'acte qu'on traite et pas sur celui d'à côté :

"- - - - - - - - - - - - - - - - - - Correction - - - - - - - - - - - - - - - - - - - "


Le brouillon contient beaucoup d'erreurs. Elles ont deux origines. D'une part les imperfections du logiciel d'interprétation de la parole, d'autre part nos difficultés de lecture, d'élocution ou de compréhension du texte que nous lisons.

Les premières peuvent être cocasses, sidérantes, énervantes, et montrent que le logiciel n'a aucune compréhension du texte, il ne fait que traduire des phonèmes en caractères, avec plus ou moins de pertinence. Il est fait pour "interpréter" nos paroles, c'est à dire comprendre ce qui relève de son algorithme et qui se trouve dans ses dictionnaires, même si nous ne le disons pas bien. Par exemple, on aura beau s'évertuer à prononcer correctement et même lourdement Jacquelaine, il écrira toujours jacqueline. Son comportement général sera de chercher une transcription d'un groupe de phonèmes, et de la resservir systématiquement lorsqu'il la retrouve. Bref, il reproduit très souvent les mêmes erreurs. En fait, il lui arrive dans un petit nombre de cas d'offrir une transcription différente des mêmes mots, c'est à dire des erreurs différentes et plus rares, presque aléatoires. Glissons sur ces fautes, ne cherchons pas à les retenir, mais concentrons nous sur l'essentiel, les mots réels du manuscrit. Ces faiblesses vont nous servir pour la correction du brouillon, mais nous pouvons anticiper et prévenir un certain nombre de ces erreurs en adoptant des comportements simples, comme parler en détachant bien les mots les uns des autres pour éviter les liaisons, ou en simplifiant notre vocabulaire. Par exemple, inutile de s'évertuer à prononcer je 'h' de Jehan, le programme ne le comprendra pas, par contre la transcription de Jean sera toujours correcte, et il ne nous restera qu'à ajouter une lettre au cours de la correction. Et c'est cela que nous chercherons à obtenir, des corrections qui demandent un minimum de touches du clavier.

Ne soyons quand même pas trop sévère avec ce logiciel, car il faut bien reconnaître que les dates, la plupart des prénoms et une bonne partie des patronymes sont transcrits très correctement, ou demandent une intervention minimale, pour des variantes plausibles.


Les erreurs de la seconde catégorie proviennent du lecteur, de notre élocution et de notre compréhension de ce que nous lisons, et nous rappellent que l'auteur du manuscrit transcrivait lui même les noms phonétiquement. La correction de ces erreurs est l'étape la plus délicate et qui demande le plus de temps. Elle peut aussi être anticipée en simplifiant notre élocution. Comment prononcer le nom "Oeuilliot" et toutes ses variantes d'écriture ? Tous nos essais pourront conduire à des résultats différents, unifions en prononçant "oyo" qui sera toujours transcrit ainsi. Notre intelligence est aussi de nous adapter à la machine, ce que la machine ne peut pas faire.


Venons en à la correction proprement dite. Nous utiliserons beaucoup la fonction "Chercher/tout remplacer" du traitement de texte pour purger le brouillon des erreurs récurrentes du programme. Attention, l'arme est délicate, ne pas hésiter à annuler une opération s'il y a un trop grand nombre de remplacements effectués. Les mots-clés courts sont dangereux car ils peuvent placer la correction à l'intérieur d'un mot. Au lieu de remplacer le mot-clé "roi" par "Roy", on remplacera " roi " par " Roy ", ce qui ne prendra en compte que le mot isolé par des espaces. Si on se rend compte d'une erreur et qu'il est trop tard pour revenir en arrière, ce n'est pas grave. Cela donnera juste un peu plus de travail pour rétablir par la même méthode les modification erronées au fil de leur découverte.

En fait, on ne connait pas le nombre d'actes lus, mais, utiliser le couple de mots-clés "baptisé" -> "baptizé" nous donnera une approximation du nombre de baptêmes présents dans notre texte, ou pour les mariages "solennellement" -> "solemnellement", le nombre de mariages. rien à faire pour les inhumations car on peut être mort ou déced(d)é, enterré ou inhumé dans le cimetière ou dans l'église. Il faudra attendre la fin de la mise en table pour connaitre le nombre exact d'actes relevés. Mais ces comptages nous donnent aussi des limites pour le nombre de remplacements, qu'on contrôlera toujours pour estimer empiriquement si on a fait une fausse manœuvre. Il est utile dans un premier temps de garder une trace de la liste des mots-clés utilisés avec leur fréquence. Il faut bien corriger une quinzaine de vues pour obtenir une liste pertinente de mots-clés qu'on pourra réutiliser d'emblée si on renouvelle un premier essai sur une autre année du registre qui nous intéresse, ou pour le prochain projet de relevé. On commencera la correction par le passage d'une ou deux centaines des meilleurs mots-clés déjà relevés, et en quelques dizaines de minutes, cela purgera le texte de toutes les erreurs ou imperfections les plus courantes. Par exemple "pierre", considéré comme un nom commun sera transformé en prénom "Pierre". Notons au passage que la majusculation des noms propres se fera à une étape ultérieure, le produit de la correction sera un texte courant, aussi proche que possible du texte original, mais sans excès de perfectionnisme. On se permettra d'introduire des notions modernes et infidèles comme les numéros de jours ou les millésimes en chiffres plutôt qu'en lettres pour les rendre mieux lisibles et les repérer plus facilement dans le corps de l'acte. Par contre, on respectera la graphie des noms et des prénoms avec leurs variantes, des outils permettront de les gérer ultérieurement.


Rapidité de la méthode

Quelques chronométrages nous montrent que le relevé par lecture au téléphone est une méthode à haut débit :

pour un acte de baptême de 3 à 6 lignes

  • lecture 1' à 2'
  • correction 2' pour un acte calligraphié ou parfaitement lisible, 5' pour un acte courant, et jusqu'à 10' et plus pour une écriture particulièrement difficile à déchiffrer
  • mise en table 1' à 1' 15" suivant le nombre de données extraites, sans limite de taille de la phrase copiée.

En tout 5' pour un acte de baptême bien lisible et plus sinon.

Pour un acte de mariage, les temps de lecture et de correction restent proportionnels à la longueur et à la difficulté de lire l'écriture. Le temps de mise en table n'excède jamais le temps de lecture du manuscrit.

Ces chiffres montrent que la méthode est rapide, ou au moins ne prend pas plus de temps qu’une entrée par dactylographie directe. Un de ses avantages est d’avoir produit en plus un texte complet, une table contenant toutes les informations du registre, au lieu d’une sélection restreinte. Un autre est le niveau élevé de fiabilité en raison du nombre de relectures qui permettent à chaque fois d'affiner le texte. Enfin, ce travail de longue haleine qui a tout d'une sinécure est finalement léger. Alors que la dactylographie est dévalorisante, induit des tensions et de la fatigue, en nous renvoyant nos fautes de frappe ou nos échecs de déchiffrage, la correction de fautes qui ne nous sont en général pas imputables, induit la satisfaction de nettoyer un texte de ses imperfections, et celle de réussir les déchiffrements parfois difficiles, ce qui est très peu anxiogène et même plutôt valorisant.


Mise en table des données

La mise en table peut être faite directement dans un tableur par dactylographie à la lecture des actes. Cela prend beaucoup de temps, est une source d'erreurs potentielles (fautes de frappe, saisies automatiques malencontreuses, etc...), et ne dispense pas d'une relecture complète du registre pour redresser les fautes passées inaperçues à la saisie.

C'est cependant une étape nécessaire pour rendre les données exploitables informatiquement. Nous allons pouvoir puiser dans le texte de la transcription de notre registre pour remplir des tables par "copier/coller". Les seules dactylographies que nous nous permettrons seront d'entrer les millésimes, numéros de jour et de mois directement au pavé numérique, ainsi que la lettre qui représente le sexe du sujet. C'est une méthode rustique, mais efficace et rapide.

Mais avant cela, il nous faut construire nos feuilles de calcul pour y loger nos données. Les colonnes utilisées devront êtres contigües et porter un titre différent, pour s'y retrouver, mais aussi pour un traitement par macros. On pourra alors entrer un acte par ligne de la table. Pas de ligne vide ou de colonne vide sans titre, ce serait fatal avec un tri. Les données étant différentes pour un baptême, un mariage et une sépulture, on devra construire trois tables. Mais au fil des lectures, on peut se rendre compte que le registre contient d'autres actes porteurs d'informations généalogiques comme comme une publication de bans, une autorisation de se marier dans une autre paroisse, une autorisation de déménagement, un service funèbre pour un marin disparu en mer ou un soldat mort à la guerre, etc... On aura pris soin de poser un mot-clé spécifique devant chaque acte spécial dans le texte final pour les retrouver facilement et ils devront chacun être introduits dans une table appropriée. Du travail en perspective !

Les principes généraux pour structurer nos données généalogiques sont d'utiliser une colonne pour le ou les prénoms d'une personne et une autre pour son patronyme, et ce pour les principales personnes citées dans l'acte. On réservera une colonne pour le sexe de la personne concernée par un baptême ou une inhumation, et une colonne d'âge pour des mariés et les défunts. Les dates seront entrées en trois colonnes, jour, mois et an, pour en simplifier la saisie, il sera facile ensuite de reconstituer une date réelle dans une autre colonne. Nous ajouterons aussi une colonne pour le numéro de vue, et si la table couvre plusieurs registres, une pour la référence du registre. Et une colonne d'index de saisie qui commence à 1 au premier acte et augmente de 1 à chaque nouvel acte introduit. Elle permettra de revenir par un tri sur cette colonne à l'ordre dans lequel les actes ont été introduits dans la table.

C'est une configuration minimale, mais beaucoup de données n'y trouvent pas leur place.

On pourra faire une configuration maximale pour prendre en compte toutes les autres données que nous avons évoquées plus haut comme la qualité. Pour chaque personne, l'auteur de l'acte a pu préciser une particularité qui méritait d'être mentionnée, un parrain peut être assisté d'une liste d'autres personnes. Tout cela impose d'ajouter au moins une colonne de qualité et une colonne de remarque pour chaque personne, une pour indiquer s'il est défunt, et pour les hommes, une colonne de métier. En tout 6 à 7 colonnes pour chaque personne citée. Sans oublier une colonne pour signaler une particularité de l'acte lui même, et peut-être d'autres lorsque nous découvrons de nouvelles information au fil de la lecture.

Il n'y a pas d'obligation de construire une table complexe, ce n'est pas un but en soi, c'est simplement une méthode. On rassemble toutes les données possibles et c'est de cette matière généalogique que notre curiosité pourra faire émerger des coïncidences, des caractéristiques, des comportements, des concepts qui vont illustrer la vie à l'époque du registre et celle de nos ancêtres. Dans cette optique, il est préférable de mettre en table toutes les données possibles plutôt que d'avoir à les repêcher plus tard dans le texte lorsqu'elles nous interpellent, ce qui est très chronophage.

Mais pour un relevé simple, on pourra se contenter d'une table minimale.

Nous commencerons par installer un curseur "mise en table" au premier acte du texte final. Avec un écran large, on disposera côte à côte l'image des archives, et le texte du relevé, et en dessous la feuille de calcul structurée, largement ouverte, mais sur quelques lignes de hauteur pour que les fenêtres ne se recouvrent que très peu. Sinon, on utilisera un ordi pour l'image et un autre pour le transfert du texte à la feuille de calcul.

Installer d'abord la date, le numéro de vue et l'index, puis transférer une par une les données du texte vers la table par "Copier/Coller".

Quand le premier acte est saisi, déplacer le curseur au suivant et continuer la saisie. Il faut pouvoir rester concentré, s'assurer que les touches 'Ctrl' est bien tenue pour presser les touches 'C' ou 'V' et que la destination contient bien ce qui doit y arriver. En cas d'erreur de ligne ou d'acte, on doit s'en apercevoir assez vite pour rectifier la saisie. Une petite erreur peut passer inaperçue et risque d'être impossible à retrouver, c'est le défaut de fiabilité de cette opération. Par contre un de ses avantages, c'est qu'on peut transférer une longue phrase en 5 secondes, alors qu'il serait impensable de la dactylographier.

Cette étape est aussi l'occasion de vérifier la cohérence de la chronologie des actes. Il arrive que des chiffres soient difficiles à lire, à cette étape, les incohérences sautent aux yeux.

Vérification de la cohérence des données

Lorsque tous les actes ont été transférés, après archivage des tableaux, et on peut commencer le travail de consolidation.

Dans un premier temps, et pour pouvoir faire des tris chronologiques, on reconstruit la date réelle dans une nouvelle colonne, par la concaténation de ses trois composants, de type jj/mm/aaaa dans Calc de LibreOffice. On obtient un texte qu'on transforme en nombre par la fonction CNUM, et en date en imposant le format de date à la colonne. Pour excel, qui ne connait pas les dates avant 1900, on gardera le texte de la concaténation en ordre inverse "aaaa mm jj", moins facile à lire, mais permettant un tri chronologique non pas sur une date, mais sur un texte.

Dans un second temps, on insère après le patronyme des parents pour un baptême ou des promis et promise pour un mariage, une nouvelle colonne destinée à recevoir un nom de référence qui sera la graphie la plus courante de leur patronyme. Cela permettra de s'affranchir des variantes des noms et de regrouper les individus qui sinon n'apparaîtraient pas côte à côte par un tri. On remplira ces colonnes petit à petit au fil des examens du fichier, ou en bloc, à chacun de trouver sa méthode. Mais c'est indispensable pour les noms qui ont des variations graphiques ou pour débusquer des incohérences.

Le travail de consolidation peut maintenant commencer. Il consiste à faire des tris sur l'ensemble de la feuille en prenant successivement pour clé de tri chaque colonne, et à examiner ensuite à la loupe toute la colonne cible, à la recherche d'incohérences. Chaque incohérence trouvée fera l'objet d'un retour à l'image du registre pour confirmation ou correction.

C'est particulièrement utile pour les patronymes, pour lesquels on pourra rectifier les lectures improbables en comparant les différentes occurrences ainsi que les époux ou les épouses associés. Ce sera d'autant plus efficace qu'on aura rempli et ajusté les colonnes des noms de référence.

On pourra faire aussi des tris par patronyme et date pour faire apparaître les couples et s'il y a des lacunes, insérer un patronyme manquant entre crochets carrés dans la colonne des remarques de la personne, le relevé est censé être une transcription fidèle, pas une interprétation du registre. Ce sera au généalogiste d'interpréter les données pour étayer son arbre. C'est aussi un dilemme pour le gestionnaire de la banque, doit-on intégrer un nom qui n'est pas écrit dans l'acte, ou produire une donnée introuvable ?

Cette étape permet de débusquer les dernières fautes de frappe, mais surtout les ambiguïtés de lecture, celles qui sont les plus problématiques.

Ce parcours du fichier dans tous les sens est déjà le début de son exploitation. Les lectures successives avaient déjà donné une idée de ce qu'il contient, on peut maintenant les confirmer ou faire des découvertes, un travail d'analyse peut commencer.

On fera un nouvel archivage à l'issue de cette consolidation.

Analyse des données du registre

Lorsque les données relevées sont le minimum usuel, la pose des noms de référence a déjà permis le regroupement des noyaux familiaux malgré les différences de graphie des noms.

L’accumulation des données peut permettre de faire des études de population, comptages annuels des naissances, mariages et décès, et d’en tirer des courbes à mettre en relation avec des événements historiques, guerres, épidémies ou autres. Mais cela n’apportera rien de nouveau car des historiens ont déjà modélisé tout cela en étudiant des villes où ces données étaient disponibles.


Par contre lorsque l’intégralité du registre a été mise en table de nouvelles données apparaissent, qui n’ont peut-être pas encore été explorées. On peut se pencher sur les dispenses, la qualité des personnes et autres informations qui apparaissent. On peut aussi remanier les tableaux du relevé en individualisant les personnes dans une nouvelle table standardisée[4] et en y transférant les personnes.

Dans ces derniers cas, il faudrait structurer certaines colonnes du tableau et créer une macro pour en extraire les données et créer des lignes supplémentaires. Le résultat est un fichier unique où on peut illustrer la vie d’une personne par toutes les citations qui en ont été faites dans les registres. Toutefois on se heurte au fait que très souvent un premier enfant porte le prénom de son parent, et que son parrain peut être un cousin homonyme. Il devient alors difficile d’identifier une personne de manière sûre. Mais lorsque le prénom est plus rare, le défilement de la vie en révèle les phases, par exemple une telle aura été trois fois marraine entre 16 et 20 ans mais telle autre l’aura été 22 fois avant son mariage à 28 ans, une piste à suivre pour identifier les réseaux d'influence. Cela peut devenir une mine lorsque de telles données peuvent être extraites de la masse des informations relevées.


L’analyse peut aussi faire appel à des documents autres que les registres. Cela demandera des investigations dans les sites d’archives départementales On privilégiera des documents qui contiennent des listes de personnes comme les rôles de taille[5], des liasses de réception de bourgeois, ou autre pépite rare[6]. Si on a la chance de trouver un rôle de taille contemporain de notre relevé, on aura une image de la richesse des habitants à cette époque. D'autres relevés en perspective.


Mise en forme et communication

Il est temps, maintenant, de mettre nos fichiers à la disposition du club pour qu'il puisse les introduire dans sa banque de données ou en faire une édition papier. On créera donc une copie de nos fichiers dans laquelle on retirera toutes les colonnes qui n'intéressent pas le club ou le gérant de la base de données pour ne garder que l'essentiel, et on mettra les patronymes en majuscule, il y a une formule pour faire cela dans les tableurs, et on insérera aussi le nom de la paroisse, voire son numéro de département.

Et ainsi nous aurons apporté notre contribution qui servira aux généalogistes qui viendront après nous.

Liens externes

Références

  1. Déclaration du Roy du 9 avril 1736
  2. arrêt du Conseil d'État du Roy du 12 juillet 1746
  3. Le généalogiste Picard n°167 page 64, 1er trimestre 2019
  4. Un modèle possible de table matérialisé par les titres de colonnes : Prénom/Nom/Reférence du Nom/Age/Sexe/Qualité/Profession/Titres/Remarque/Observation/Qualité père/Prénom Père/Nom Père/Note Père/Qual mère/Prénom Mère/Nom Mère/Note mère/Qual Epoux/Prénom Epoux/Nom Epoux/Note Epoux/Date/Evénement/Statut à l'Eve/Parenté à l'Eve/Note événement/Qual Perso 1 Eve/Prénom Perso 1 Eve/Nom Perso 1 Eve/Note Perso 1 Eve/Qual Perso 2 Eve/Prénom Perso 2 Eve/Nom Perso 2 Eve/note Perso 2 Eve/Jour/Mois/An/
  5. Chroniques de St Valery sur Somme. IV Le rôle de taille de 1756 ; à paraître dans "Le Généalogiste Picard"
  6. Chroniques de Saint Valery sur Somme : V Les collecteurs du taillon ; à paraître dans "Le Généalogiste Picard"