Wikibase Résistance : un processus en six étapes
Nous vous l’expliquions en novembre dernier : le CegeSoma coordonne un projet ambitieux (Wikibase-Résistance) visant à créer un outil de recherche avancée sur les personnes impliquées dans des activités de résistance en Belgique durant la Seconde Guerre mondiale.
À l’heure actuelle, des données issues de plus de 72 000 dossiers personnels de résistants conservés au CegeSoma ont été encodées. Une progression redevable aux efforts déployés ces derniers mois par une équipe de 15 personnes (bénévoles, jeunes volontaires et membres du personnel administratif), qui s’y consacrent de 1 à 3 jours par semaine.
Avant la mise en ligne de ces données et la possibilité d’effectuer des recherches parmi tous ces acteurs et actrices de la résistance belge, plusieurs étapes sont toutefois encore nécessaires. En effet, l’encodage constitue seulement la première des six étapes prévues. Passons-les en revue :
- La première étape, l’encodage, vise à encoder dans un fichier informatique des données sur ces résistants (comme leur nom, leur date de naissance ou leur appartenance à un réseau de résistance), à partir des formulaires et dossiers personnels contenus dans des fonds d’archives relatifs à la résistance, tels que les Archives des Services de renseignements et d’action.
- La seconde étape, le contrôle, a pour objectif de vérifier la qualité et la cohérence des données tant au niveau de la forme que du fond, en prenant notamment en compte ce qui a été encodé dans la colonne 'Remarques'.
- La troisième étape, l’alignement, consiste à établir des correspondances entre les noms de personnes ou de lieux et des référentiels externes (comme GeoNames pour les lieux ou Wikidata pour les personnes), afin de limiter les ambiguïtés et de pouvoir enrichir les données.
- La quatrième étape, le dédoublonnage vise à identifier de façon semi-automatisée si plusieurs lignes des fichiers se rapportent à une seule et même personne.
- La cinquième étape, le formatage, est une étape technique permettant d’adapter les données encodées au format de destination.
- La sixième et ultime étape, l’importation, repose sur l’utilisation d’outils destinés à charger massivement tout le contenu sur la plateforme de stockage et de publication des données.
Si vous souhaitez suivre l’évolution du projet, rejoignez-nous sur la page Facebook du CegeSoma, où nous partagerons au cours des mois à venir des détails sur les contenus, les aspects techniques et les coulisses du projet.