Qualität

Funktionen zur Sicherung und Kontrolle der Qualität

docuteam packer bietet verschiedene Möglichkeiten für die Qualitätssicherung und -kontrolle an.

Vorschau

Um Dateien eines SIP effizient zu bewerten, bietet docuteam packer die Möglichkeit einer Vorschau an. Diese befindet sich in der Detailansicht des SIP unter dem Tab "Vorschau".

Vorschau

Um diese Funktionalität zu nutzen, müssen die betroffenen Formate in der Konfigurationsdatei filePreviewConfigurator.properties hinterlegt sein (als PUID (PRONOM Unique Identifier), MimeType oder nach Extension). Diese Datei befindet sich unter docuteam-packer/config.

Dateimigrationen

In docuteam packer können direkt von der Detailansicht eines SIP aus einzelne Dateien in ein anderes Dateiformat migriert werden. Dies empfiehlt sich für eine feingranulare Steuerung von Migrationen.

Um eine Migration durchzuführen, kann das gewünschte Objekt mit Rechtsklick angewählt und die Option "Dateien konvertieren" ausgewählt werden. Die Aktion muss bestätigt werden. Zusätzlich muss angegeben werden, ob das Original behalten oder nach der Migration gelöscht werden soll.

Original behalten

Wird das Original behalten, wird ein neuer Ordner erstellt und darunter das Original sowie das Migrationsresultat angehängt. Die Metadaten werden vom Original auf das übergeordnete Element übertragen, nicht jedoch auf das Element des Migrationsresultat.

Um eine Migration durchzuführen, muss eine entsprechende Anweisung hinterlegt werden. Sie besteht aus der Angabe des Ursprungsformats, des gewünschten Zielformats sowie der Applikation, welche die Migration durchführen soll.

Die Konfiguration für Formatmigrationen wird in der Datei migration-config.xml definiert. Sie befindet sich unter docuteam-packer/config.

Die Datei besteht aus zwei Teilen:

  • im ersten Teil werden die Tools für die Formatmigration angegeben.
  • Im zweiten Teil befindet sich die Auflistung sämtlicher Formate, die migriert werden sollen unter Angabe des zu verwendenden Tools.

    Beispiele für die Definition von Applikationen in migration-config.xml:
<config>
	<application
		id="1"
		name="OpenOffice"
		executable="Class:ch.docuteam.converter.OOConverter"
		parameter="{[arg1]}#{[arg2]}" />

	<application
		id="2"
		name="ImageMagick"
		executable="C:/Apps/ImageMagick/magick.exe"
		parameter="-compress#none#{[arg1]}#{[arg2]}" />
...
</config>

id bezeichnet die ID der Applikation, die im zweiten Teil für die Konfiguration der Formatmigration referenziert wird. executable enthält die Java-Klasse oder den Pfad zur ausführbaren Datei des Tools. parameter kann spezifische Optionen des Tools enthalten. Zusätzlich werden mit {[arg1]} und {[arg2]} Input- und Output-Datei referenziert.

Beispiele für die Definition von Instruktionen in migration-config.xml:

<config>
...
	<puid
		name="fmt/123"
		applicationID="2"
		targetExtension="tif"
		targetPronom="fmt/353" />

	<extension
		name="pdf"
		applicationID="1"
		targetExtension="pdf"
		targetPronom="fmt/354" />

	<mimeType
		name="image/tiff"
		applicationID="2"
		targetExtension="tif"
		targetPronom="fmt/353" />

</config>

Eine Migrationsinstruktion kann über 3 Tags definiert werden, je nach dem anhand welcher Eigenschaft ein Format migriert werden soll: PUID, Dateiendung oder MimeType. PUID steht für PRONOM Unique Identifier und ist in der Archivwelt ein anerkannter Identifikator für spezifische Dateiformate. name bezeichnet den Wert der Eigenschaft. Möchte man beispielsweise, dass sämtliche Dateien, die eine PUID fmt/123 (Encapsulated PostScript File Format) aufweisen, in ein Tiff migrieren, gibt man im Attribut name den Wert "fmt/123" an. Man definiert das Tool, das dafür verwendet werden soll über die applicationID. Der Wert dieser ID muss im ersten Teil der migration-config.xml definiert worden sein. In diesem Fall ist es das Tool mit der ID 2, also Image Magick. Schliesslich werden mit den Attributen targetExtension und targetPronom die Werte für das Zielformat angegeben. targetPronom bezieht sich dabei auf die PUID des Zielformats. Im Beispiel soll ein Tiff mit der PUID fmt/353 erstellt werden.

Submission Agreements

Submission Agreements (Ablieferungsvereinbarungen) ermöglichen es, anhand der Angabe erlaubter Dateiformate zu überprüfen, ob sich Objekte mit unerwünschten Dateiformaten in einem SIP befinden und diese direkt zu löschen. Daneben können weitere Angaben im Submission Agreement hinterlegt werden wie Angaben zum Archiv, zur abliefernden Stelle oder Angaben zu einzelnen Ablieferungen.

Die Submission Agreements werden als XML-Dateien in docuteam-packer/agreements hinterlegt. Beim Erstellen eines SIP kann das gewünschte Submission Agreement über das Dropdown-Menü ausgewählt werden.

Submission Agreement auswählen

In der Detailansicht eines SIP kann über den Menüpunkt "SA" > "Prüfen oder zuweisen..." das gewünschte Submission Agreement für eine Überprüfung angewendet werden. Durch Klick auf den Button "Play" wird eine Prüfung durchgeführt und sämtliche Objekte, deren Dateiformat im Submission Agreement unter fileFormats nicht explizit aufgeführt sind, aufgelistet. Danach kann ausgewählt werden, ob die Objekte sofort gelöscht oder markiert werden sollen.

Objekte prüfen

Befindet sich kein Tag fileFormats im Submission Agreement, sind alle Formate erlaubt.

Im folgenden Beispiel werden nur JPEG-Dateien akzeptiert, welche die PUID fmt/43 (PRONOM Unique Identifier), den MimeType image/jpeg oder die Dateiendung jpg haben:

<fileFormats strict="true">
	<puid>fmt/43</puid>
	<mimetype>image/jpeg</mimetype>
	<extension>jpg</extension>
</fileFormats>

Checksummen prüfen

Möchte man die Integrität der Dateien, die sich im SIP befinden, überprüfen, kann in der Detailansicht des SIP die Aktion "Paket" > "Checksummen überprüfen" ausgeführt werden. Die Checksummen (Prüfsummen) werden für jede Datei einzeln berechnet und mit der Checksumme der Datei, die in den Metadaten (mets.xml) hinterlegt ist, abgeglichen. Die Durchführung sowie das Resultat (erfolgreich oder nicht) wird als Premis-Event in die Metadaten aufgenommen.

Duplikate entfernen

Über den Menüeintrag "Paket" > "Duplikate entfernen" wird ein Dialog geöffnet, der ggf. identische Dateien anzeigt. Die Identität wird über die Checksumme festgestellt. Über das Dialogfenster können aufgeführte Dateien gelöscht werden. Dabei ist es nicht gestattet, alle Dateien der gleichen Checksumme zu löschen.

Kassationselemente löschen

Die Aktion "Paket" > "Kassationselemente löschen" bedingt, dass im levels.xml eine entsprechende Stufe für die Kassation definiert wurde. Ist dies der Fall, werden Elemente dieser Stufe über diese Aktion gelöscht.