воскресенье, 21 ноября 2010 г.

Новая версия DSpace

В скором времени, а именно 17 декабря (хотя возможно и 3, это как пойдет) состоится релиз новой версии DSpace под номером 1.7. C нововведениями и подробностями выхода  можно ознакомиться здесь.

Установка DSpace

Как уже упоминалось, DSpace является кроссплатформенным приложением. Кроссплатформенность достигается за счет использования Java. DSpace реализован как J2EE приложение, а для его работы достаточно J2EE контейнера. Для хранения метаданных и прочей сопутствующей информации допускается использовать Oracle либо PostgreSQL. Так же на сервере должны быть установлены JDK (Java Development Kit), Apache Maven, Apache Ant и Tomcat, эти приложения нам понадобятся для сборки DSpace.

В качестве ОС на сервере будет использоваться Ubuntu Server 10.10.

среда, 10 ноября 2010 г.

Процесс поглощения и рабочий процесс в DSpace

Импорт данных в DSpace осуществляется по средствам приложения "Batch Item Importer" (импортер пакетов элементов - из за отсутствия русской документации, лучше названия не придумал =) )
ingesting process - Процесс поглощения
На вход Batch Item Importer подается ExternalSIP (Submission Information Package - расширенный пакет подачи информации - это xml файл, содержащий метаданные и файлы контента), далее обработанная информация уходит в объект  InProgress Submission (процесс приема) , как видно из диаграммы добавление через web интерфейс использует тот же механизм, оно и логично.
Далее в зависимости от политики коллекции в которую мы собираемся добавить новый материал может стартовать "Workflow" (рабочий процесс), это позволяет осуществлять проверку данного материала и дать гарантию его пригодности к выбранной коллекции.
Следующим этапом процесса поглощения является ItemInstaller (инсталляция объекта), в Дублинское ядро (это стандарт описания метаданных, более подробно с ним можно ознакомиться здесь: rus, eng) добавляется сообщение о "происхождении", которое включает в себя имена файлов и контрольные суммы, добавляемого контента.
При успешном завершении WorkFlow объект InProgressSubmission передается в ItemInstaller (инсталлятор элементов), который конвертирует его в полностью соответствующий архивированный элемент DSpace. 
Немного подробнее рассмотрим функции ItemInstaller'а
  • назначения даты внесения;
  • добавление значения  "date.availeble" в метаданные дублинского ядра;
  • добавление даты выпуска (если ничего другого нет);
  • добавление сообщения происхождения (включающего в себя контрольные суммы файлов);
  •  назначение Handle (постоянного идентификатора дескриптора);
  • добавление элемента в коллекцию, и соответствующей политики авторизации;
  • добавление нового элемента к индексам поиска и просмотра.
По своей сути пост является свободным переводом пункта 2.9. Ingest Process and Workflow в документации к DSpace.

Далее будет более подробно рассмотрен процесс импорта контента при помощи Batch Item Importer