вторник, 7 декабря 2010 г.

Импорт данных DSpace

В DSpace предусмотрена система импорта данных, она достаточно проста, но как следствие и примитивна.
Вскоре мы подробно разберем каждый пункт импорта, а пока что разберем импорт данных на небольшом примере. Для начала структурировать файлы в следующей форме:
archive_directory/
    item_00/
        dublin_core.xml -- xml файл содержащий описание в форме дублинского ядра (далее DC)
        contents   --  список имен прилежащих файлов
        file_1.ext  -- собственно сами файлы
        file_2.ext
    item_01/
        dublin_core.xml
        ...
Рассмотрим возможное содержание файла dublin_core.xml:
<?xml version="1.0" encoding="UTF-8"?>
<dublin_core>
 <dcvalue element="contributor" qualifier="author">Public, John Q.</dcvalue>
 <dcvalue element="language" qualifier="iso">en</dcvalue>
 <dcvalue element="subject" qualifier="none">Technology</dcvalue>
 <dcvalue element="title" qualifier="none">Sample Dublin Core Record</dcvalue>
</dublin_core>
element - это элемент DC
language - 2ух символьный ISO код языка для элемента
qualifier - это элемент определителя
В следующей статье более подробно разберем структуру этого документа.

В contents вписываем названия сопутствующих файлов,по одному в каждой строке, в нашем случае :
file_1.ext
file_2.ext
Файлы готовы для импорта в репозиторий и осталось воспользоваться скриптом import
[dspace]/bin/import -a -e ЭЛЕКТРОННАЯ_ПОЧТА -s ПУТЬ_ДО_ARCHIVE_DIRECTORY -c COLLECTION_ID
Для данного примера этой информации будет достаточно, в дальнейшем будем рассматривать более конкретно каждый пункт.

1 комментарий:

  1. в седьмой версии изменилась сигнатура скрипта импорта
    [dspace]/bin/dspace import -a -e joe@user.com -c CollectionID -s items_dir -m mapfile

    ОтветитьУдалить