Zum Hauptinhalt springen
Version: 6.6

Ingest

Das Package "ingest" beinhaltet Schritte für den Ingestprozess.

Ingest: convert BAR-SIP

Konvertiert ein SIP in ein SIP, welches dem Matterhorn Profil entspricht.

java ch.docuteam.actions.ingest.BARSIPConverter \
[path/to/]SIP [targetFolder]
ParameterBeschreibung
[path/to/]SIPname of the SIP; if no path is given, it will be expected to be in the location defined by the actions.workbench.inbox property
[targetFolder]directory where to move the created SIP to; if omitted, the SIP will be moved to the location defined by the actions.workbench.work property

Ingest: create SIP from eCH-0160 SIP

Erstellt ein auf dem Matterhorn Profil basierendes SIP aus einem eCH-0160 SIP.

java ch.docuteam.actions.ingest.CreateSIPFromECH0160SIP \
--sip=[path/to/]SIP \
--levelsFilePath=/path/to/levels.xml \
--[mappingFile=[path/to/]mappingFile] \
--[output-folder=/path/to/folder]
ParameterBeschreibung
--sip=[path/to/]SIPlocation of the SIP to convert; default lookup folder is actions.workbench.inbox
--levelsFilePath=/path/to/levels.xmlpath to the file levels.xml
--[mappingFile=[path/to/]mappingFile]file from which to read the mapping; defaults to a default mapping file (defined by the mapping module)
--[output-folder=/path/to/folder]indicate the output folder; defaults to actions.workbench.work

Ingest: check workbench space

Prüft, ob genügend Platz für die Verarbeitung des SIPs (d.h. für Arbeitskopien) vorhanden ist.

java ch.docuteam.actions.ingest.CheckWorkbenchSpace \
[path/to/]SIP [numberOfCopies]
ParameterBeschreibung
[path/to/]SIPname of the SIP. If no path is given, it will be expected to be in the location defined by the actions.workbench.work property
[numberOfCopies]optional, number of copies to calculate with; defaults to 3

Ingest: cleanup working copies

Löscht vorhandene SIPs in actions.workbench.work. Optional können auch gleichnamige SIPs in actions.workbench.preparation gelöscht werden.

java ch.docuteam.actions.ingest.Cleanup \
[path/to/]SIP [prep]
ParameterBeschreibung
[path/to/]SIPname of the SIP. If no path is given, it will be expected to be in the location defined by the actions.workbench.work property
[prep]if true, SIPs of the same name in actions.workbench.preparation will be removed as well; defaults to false

Ingest: create EAD file

Erstellt aus einzelnen Knotenpunkten von einem gegebenen SIP EAD-Datenblöcke.

java ch.docuteam.actions.ingest.CreateEADFile \
[path/to/]SIP [targetFilename]
ParameterBeschreibung
[path/to/]SIPname of the SIP; if no path is given, it will be expected to be in the location defined by the actions.workbench.work property
[targetFilename]optional, name of the output file; defaults to EAD.xml within the SIP's subfolder in the location defined by the actions.workbench.output property

Ingest: extent calculator

Setzt die Anzahl Dateien in das Metadatenfeld "Umfang" und die Einheit auf den Default-Wert "Datei(en)".

java ch.docuteam.actions.ingest.ExtentCalculator \
[path/to/]SIP
ParameterBeschreibung
[path/to/]SIPname of the SIP; if no path is given, it will be expected to be in the location defined by the actions.workbench.work property

Ingest: migrate files

Vergleicht die Dateien eines SIP mit den Angaben in der Konfigurationsdatei migration-config.xml und konvertiert die Dateien gemäss den dort angegebenen Konvertierungsrichtlinien.

java ch.docuteam.actions.ingest.SIPFileMigrator \
[path/to/]SIP keepOriginals [path/to/migration-config.xml]
ParameterBeschreibung
[path/to/]SIPname of the SIP; if no path is given, it will be expected to be in the location defined by the actions.workbench.work property
keepOriginals{ true
[path/to/migration-config.xml]optional, path to a specific migration configuration file (defaults to ./config/migration-config.xml)
[skipAlreadyMigratedFiles]optional, { true

Ingest: remove SIP from inbox

Verschiebt ein vorhandenes SIP aus actions.workbench.inbox in einen vorgegebenen Ordner oder löscht es, sofern kein Zielordner angegeben ist.

java ch.docuteam.actions.ingest.SIPRemoveFromInbox \
[path/to/]SIP [targetFolder]
ParameterBeschreibung
[path/to/]SIPpath of the SIP; if no path is given, it will be expected to be in the location defined by the actions.workbench.inbox property
[targetFolder]directory where to move the SIP to; if omitted, the SIP will be deleted

Ingest: replace file

Ersetzt eine Datei in einem SIP. Dabei werden die Metadaten beibehalten oder ergänzt. Zurzeit können mit diesem Schritt nur SIPs verarbeitet werden, die eine einzelne Datei enthalten.

java ch.docuteam.actions.ingest.ReplaceFile \
[path/to/]SIP [targetFolder]
ParameterBeschreibung
[path/to/]SIPpath of the SIP; if no path is given, it will be expected to be in the location defined by the actions.workbench.work property
[targetFolder]path to the file to be used as replacement of the current SIP content

Ingest: get MARC from REST and add to SIP

Für jedes Objekt (Dateien als auch Ordner) eines SIPs wird eine MARC-Beschreibung geholt und als beschreibene Metadaten hinzufgefügt.

Die URL des webservices ist in den actions.properties als "aleph.webservice.url" zu konfigurieren. Die URL sollte einen Platzhalter documentNumber enthalten, der durch die effektive Dokument-Nummer ersetzt wird. Letztere wird für jedes Objekt anhand des Dateinamens ermittelt:

  • Für einen Dateinamen BAU_5_000000444.wav wird die Dokument-Nummer 000000444 extrahiert
  • Für einen Ordnernamen DIRECTORY_X_000000555 wird die Dokument-Nummer 000000555 extrahiert

Wenn der HTTP-Request fehlschlägt oder ein Dateiname ungültig ist bricht die Aktion ab und das SIP wird nicht geändert. Bestehende MARC-Metadaten werden mit dieser Aktion überschrieben.

java ch.docuteam.actions.oai_dc.AddOAIDCFromRESTByIDFromFilename \
--sip=[path/to/]SIP
ParameterBeschreibung
--sip=[path/to/]SIPlocation of the SIP to convert; default lookup folder is actions.workbench.work

Ingest: add OAIDC from REST by ID from filename

Für das Wurzel-Objekt eines SIPs wird ein webservice für die OAI_DC-Beschreibung abgefragt und als beschreibene Metadaten hinzufgefügt.

Die URL des webservices ist in den actions.properties als "oai.webservice.url" zu konfigurieren. Die URL sollte einen Platzhalter {identifier} enthalten, der anhand des Knotennamens gemäss folgendem Muster ersetzt wird:

  • “Kürzel-SignaturTIFF” z.B. “bbb-0027TIFF” wird zum {identifier} "bbb/0027".

Wenn der Name ungültig ist oder der HTTP-Request fehlschlägt bricht die Aktion ab und das SIP wird nicht geändert. Bestehende OAI_DC-Metadaten werden mit dieser Aktion nicht überschrieben sondern führen ebenfalls zum Abbruch der Aktion.

Die OAI_DC-Informationen werde zusätzlich nach <dc:relation/>-Elemente geprüft, die auf XML-Dateien verweisen. Werden solche gefunden, speichert die Aktion diese Dateien (bei mehreren Varianten die deutschsprachige) im aktuellen Paket in einen Unterordner mit der Bezeichnung "TEI-Handschriftenbeschreibungen".

java ch.docuteam.actions.oai_dc.AddOAIDCFromRESTByIDFromFilename \
--sip=[path/to/]SIP
ParameterBeschreibung
--sip=[path/to/]SIPname of the SIP; if no path is given, it will be expected to be in the location defined by the actions.workbench.work property

Ingest: convert an EDIDOC package into a Matterhorn METS SIP

Erstellt ein auf dem Matterhorn METS Profil basierendes SIP aus einem EDIDOC-Paket.

java ch.docuteam.actions.ingest.CreateSIPFromEdidocSIP \
--sip=[path/to/]SIP \
--levelsFilePath=path/to/levels.xml \
[--mappingFile=path/to/mappingFile] \
[--outputFolder=/path/to/folder] \
[--steuerXml=/path/to/file]
ParameterBeschreibung
--sip=[path/to/]SIPlocation of the package to convert; default lookup folder is actions.workbench.inbox
--levelsFilePath=path/to/levels.xmlpath to the level configuration file, to be found to the classpath
[--mappingFile=path/to/mappingFile]file from which to read the mapping; defaults to ./config/edidoc-mapping.xml, to be found to the classpath
[--outputFolder=/path/to/folder]indicate the output folder; defaults to actions.workbench.work
[--steuerXml=/path/to/file]path to the EDIDOC archives extension XML file

Ingest: update xml file in SIP using xslt

Mit dieser Funktion kann eine XML-Datei, die sich im SIP befindet, mit einer anzugebenden XSL-Transformation aktualisiert werden.

java ch.docuteam.actions.ingest.ModifyFileWithXSL \
--sip=[/path/to/]SIP \
--xml=path/to/file.xml \
--xsl=path/to/transformation.xsl
ParameterDescription
--sip=[path/to/]SIPname of the SIP; if no path is given, it will be expected to be in the location defined by the actions.workbench.work property
--xml=path/to/file.xmlpath to xml file within the SIP to be transformed (relative to the SIP's root node)
--xsl=path/to/transformation.xslpath to the xsl script to be used in the transformation (if relative, assume xsl resides in $ACTIONS_HOME/xslt)