Zum Hauptinhalt springen

Migration F3 -> F6

Kontext

Seit dem letzten Release von Fedora 3, das 2015 veröffentlicht wurde, hat docuteam die Entwicklungen der darauffolgenden Versionen der Fedora Repository Software genau verfolgt. Mit der Version 6 steht nun eine passende Lösung zur Verfügung, die den Wechsel auf eine moderne Plattform ohne Nachteile bei den zugrundeliegenden Technologien ermöglicht. Gleichzeitig hat sich ein neuer Verzeichnungsstandard für Archivalien "Records in Contexts" (RiC) herausgebildet, der mit den Linked-Data-Technologien, die Fedora 6 zu Grunde liegen, kompatibel ist.

Vor dem Hintergrund dieser beiden Entwicklungen haben wir unsere Werkzeuge aktualisiert - und neue hinzugefügt - um die neue technologische Plattform sowie das neue konzeptuelle Modell von RiC zu unterstützen.

Für bestehende Nutzerinnen und Nutzer von docuteam cosmos ist die Migration des Langzeitarchivs eine Aktivität, die sorgfältig geplant, durchgeführt und überprüft werden muss. Hier ein Überblick über den Ablauf und die anfallenden Aufgaben.

Vorbereitung Infrastruktur

Die Migration erfolgt unter der Annahme, dass der Fedora 6 Repository-Stack parallel zum bestehenden Fedora 3-Stack installiert und betrieben wird, bis die Datenmigration und die Überprüfung der Migration erfolgreich abgeschlossen sind. Der Fedora 6-Stack wird daher eine eigene Serverinstanz für die Installation benötigen - ein In-Place-Upgrade von Fedora 3 oder eine Möglichkeit, beide Versionen auf derselben Serverinstanz zu betreiben, wird es nicht geben.

Datenanalyse

Parallel zum Aufbau der neuen Infrastruktur werden die bestehenden Objekte im Fedora 3-Repository einer inhaltlichen und strukturellen Validierung unterzogen. Diese Validierung erstellt einen Bericht mit Objekten, die nicht dem generischen Objektmodell von docuteam entsprechen. Dies wird bei Kunden der Fall sein, die zusätzliche/abweichende Metadaten hinzugefügt oder z.B. manuelle Änderungen an den Repository-Objekten vorgenommen haben. docuteam wird in solchen Situationen Rücksprache halten, um sicherzustellen, dass solche Situationen entweder vor der Migration behoben oder während des eigentlichen Verfahrens berücksichtigt werden.

Datenmigration

Sobald der neue Repository-Stack eingerichtet ist und alle während der Datenanalyse entdeckten Probleme behoben sind, beginnen wir mit der eigentlichen Datenmigration. Der Prozess besteht aus zwei Workflows: Einem, der nach noch nicht migrierten PIDs sucht und für jede einzelne ein Ereignis erzeugt. Ein zweiter Workflow verarbeitet eine gegebene PID: Er extrahiert das DIP für die gegebene PID, wandelt das XML (METS, EAD, PREMIS) in RDF (RiC, PREMIS) um und erstellt die entsprechenden Ressourcen in der LD-Plattform (Fedora 6). Während diese Datenmigration läuft, kann der reguläre Betrieb fortgesetzt werden - entweder durch doppelte Speichervorgänge in F3 und F6 oder durch wiederholtes Starten der Migration.

Verifikation

Die Überprüfung der Migration erfolgt durch den Vergleich der ursprünglichen Fedora-Objekt-XML-Dateien (FOXML) mit einer FOXML-Datei, die über die box-API auf der Grundlage der Daten in Fedora 6 erstellt wurde.

Aufräumen und Abbau der F3-Infrastruktur

Wenn die Datenmigration auf Korrektheit und Vollständigkeit überprüft wurde, wird die Fedora 3-Instanz abgeschaltet, und der Ingest-Workflow speichert nur noch in das Fedora 6-Repository.