Wikibase Verzet : een proces in zes fases
In november vorig jaar hebben we gemeld dat CegeSoma een ambitieus project coördineert (Wikibase-Verzet). Dat heeft als doel een geavanceerd onderzoeksinstrument te creëren over de mensen die gedurende de Tweede Wereldoorlog betrokken waren bij verzetsactiviteiten in België.
Momenteel zijn de gegevens gecodeerd van meer dan 72 000 individuele dossiers van verzetslieden die in het CegeSoma bewaard worden, dankzij de inzet in de voorbije maanden van een ploeg van 15 mensen (vrijwilligers – oud en jong – en administratief personeel), die er 1 tot 3 dagen per week aan werken.
Vooraleer deze gegevens online gezet worden en er opzoekingen verricht kunnen worden over al die actoren van het Belgische verzet, moeten er echter nog een aantal stappen worden doorlopen. Het coderen is immers maar de eerste van zes voorziene fases. Laten we ze hier eens overlopen:
- In de eerste fase, het coderen, worden bepaalde gegevens over de verzetslieden in een digitaal bestand opgeslagen (hun naam, geboortedatum, lidmaatschap van een verzetsnetwerk) op basis van de individuele dossiers en formulieren uit de archieffondsen over het verzet, zoals het Archief van de Inlichtingen- en Actiediensten.
- De tweede fase, de controle, heeft als doel de kwaliteit en coherentie van de gegevens na te kijken, zowel qua vorm als qua inhoud, waarbij vooral rekening gehouden wordt met de vermeldingen in de kolom Bemerkingen.
- In de derde fase, het linken, worden er verbanden gelegd tussen de namen van individuele personen of plaatsnamen en externe gegevensbestanden (zoals GeoNames voor de plaatsnamen of Wikidata voor de persoonsnamen). Dat moet twijfelgevallen beperken en de gegevens verrijken.
- In de vierde fase, de deduplicatie, wordt semiautomatisch nagegaan of verschillende lijnen in de bestanden over één en dezelfde persoon gaan.
- De vijfde fase, het formatteren, is een technische stap om de gecodeerde gegevens aan te passen aan het formaat van de bestemming.
- De zesde en laatste fase, het importeren, verloopt via tools om het bestand volledig op te laden op het opslag- en publicatieplatform.
Als u op de hoogte wil blijven van de voortgang van het project, volg ons dan op de Facebookpagina van het CegeSoma waar we de komende maanden gedetailleerd zullen berichten over de inhoud, de technische aspecten en de achtergronden van het project.