Xena (software)

Xena è un software open source per la conservazione digitale . Xena è l’abbreviazione di XML Electronic Normalizing for Archives.

Xena è un’applicazione Java sviluppata dal National Archives of Australia . È disponibile gratuitamente sotto la GNU General Public License .

La versione 6.1.0 è stata rilasciata il 31 luglio 2013. Il codice sorgente e i binari per Linux, OS X e Windows sono disponibili da SourceForge .

Modalità di operazione

Xena tenta di evitare l’obsolescenza digitale convertendo i file in un formato esplicitamente aperto, come ODF o PNG . Se il formato del file non è supportato o se è selezionata l’opzione Normalizzazione binaria, Xena eseguirà la codifica ASCII Base64 su file binari e avvolgerà l’output nei metadati XML. Il file .xena risultante è di solo testo, sebbene il contenuto dei dati stessi non sia direttamente leggibile dall’uomo. Il file originale esatto può essere recuperato eliminando i metadati e invertendo la codifica Base64, utilizzando un visualizzatore interno.

Caratteristiche

Piattaforme supportate da Xena sono Microsoft Windows , Linux e Mac OS X .

Xena utilizza una serie di plugin per identificare i formati di file e convertirli in un formato appropriato specificato.

Xena ha un’interfaccia di programmazione delle applicazioni che consente a qualsiasi sviluppatore Java ragionevolmente esperto di sviluppare un plugin per coprire un nuovo tipo di file.

Xena può elaborare singoli file o intere directory. Durante l’elaborazione di un’intera directory, può conservare la struttura di directory originale dei record convertiti.

Xena può creare versioni in formato testo di formati di file come TIFF , Word e PDF , con l’uso di Tesseract (software) .

L’interfaccia Xena o Xena Viewer può essere utilizzata per visualizzare o esportare un file Xena (estensione .xena) nel suo formato file di destinazione. Questi file contengono il file normalizzato e tutte le informazioni aggiuntive rilevanti per il processo di normalizzazione. Xena Viewer supporta l’esportazione di massa dei file Xena nei formati di file di destinazione.

Xena può essere utilizzato tramite la sua interfaccia utente grafica o la riga di comando .

Perché Xena sia completamente funzionale, richiede un’installazione locale del seguente software esterno:

  • Suite LibreOffice – per convertire i documenti dell’ufficio in formato OpenDocument
  • Tesseract : per creare versioni in testo semplice di formati di file
  • ImageMagick – per convertire un sottoinsieme di file immagine in PNG
  • Readpst – per convertire i file PST di Microsoft Outlook in XML. Readpst fa parte della suite libpst gratuita e open source .
  • FLAC – per convertire file audio in formato FLAC. Questo è necessario anche per riprodurre file audio usando Xena.

Tipi di file supportati

Xena riconoscerà ed elaborerà i tipi di file elencati di seguito, oltre ad alcuni altri di minore importanza. I tipi di file non supportati subiranno automaticamente la normalizzazione binaria.

Formati di file di Office:

  • I file di Microsoft Office (inclusi MS Office XML , fogli di calcolo SYLK e Rich Text Format ) vengono convertiti nei file OpenDocument corrispondenti
  • I file PST di Microsoft Outlook vengono analizzati per i loro singoli messaggi, che vengono convertiti in file XML e viene creato un file indice Xena
  • I file MPP di Microsoft Project vengono convertiti in XML
  • I file XML di OpenOffice.org (SXC, SXI, SXW) vengono convertiti nei formati OpenDocument corrispondenti
  • I file WordPerfect WPD vengono convertiti in OpenDocument ODT
  • I documenti OpenDocument (ODT, ODS, ODB, ODP) vengono mantenuti invariati
  • I file Acrobat PDF sono memorizzati come file binari
  • I file mailbox (MBX) vengono convertiti in singoli file XML

Grafica:

  • BMP , GIF , PSD , PCX , RAS e il sistema X Window I file bitmap XBM e XPM vengono convertiti in PNG ; I file TIFF includono inoltre i metadati incorporati memorizzati in Xena XML. Se è installato il software Tesseract OCR , il testo verrà estratto dai file TIFF.
  • I disegni OpenDocument (ODG) e SVG sono racchiusi in Xena XML
  • I file JPG e PNG sono memorizzati invariati

File di archivio:

  • I file vengono estratti dagli archivi ( ZIP , GZIP , TAR / TAR.gz , JAR , WAR , Mac binario) e normalizzati in un file Xena separato. Viene creato un file indice Xena, che quando viene aperto nel visualizzatore Xena interno visualizza i file in una tabella.

File audio:

  • I formati MP3 , WAV , AIFF e OGG vengono convertiti in file FLAC .

Banche dati:

  • I file SQL vengono elaborati come testo semplice avvolto in XML

Altri tipi di file:

  • HTML viene convertito in XHTML
  • I file di testo TXT vengono archiviati come testo semplice avvolto in XML; I file CSS sono archiviati come testo semplice avvolto in XML

Recensioni

Una recensione del 22 aprile 2010 in Pratica e-Records ha valutato Xena a 82/100 punti. Al momento Xena non ha un formato di conservazione del target per i file video. [1]

Riferimenti

  1. Salta su^ “Rassegna del software di normalizzazione XENA” . 2010-04-22. Archiviato dall’originale in data 2012-07-08.