Как оцифровать все архивы России

Итак, имеется задача оцифровать все документы во всех архивах нашей страны. Делаем следующее:

  1. Сводим базу данных "Архивный фонд" со всех регионов и муниципалов в единую базу, представляющую из себя каталог документов с описания, анотация и всякими реквизитами (часть данных можно будет выкинуть, так как они просто не нужны в ЦХД)
  2. Создаём огромное и надёжное хранилище файлов, способное надёжно сохранять и предоставлять доступ к любому цифровому документу, а так же обеспечивающее надёжное хранение
  3. Создаём вебсервис, связанный с сводной БД "Архивный фонд" и способный автоматически обрабатывать тысячи запросов в минуту
  4. Внедряем в каждый архив, заполнивший и сдавший БД "Архивный фонд", сканер, способный создавать качественные цифровые копии любых документов (наверно исключая карты и чертежы на первом этапе)
  5. Обеспечиваем каждый такой архив надёжным и качественным интернет каналом
  6. Назначаем в этих архивах людей отвественных за сканирование и заполнение Центрального Цифрового Хранилища Документов (ЦЦХД)
  7. Начинаем сканировать документы до самого последнего, а затем закрываем архивы

Имеется следующий технической момент, который необходимо пояснить:

  1. При сканировании документов дела человек будет вводить через панель сканера реквизиты: номера фонда, описи, дела, а так же, возможно, указывать какая сторона документа отсканирована
  2. Затем сканер созадёт цифровую копию (TIFF+lzma, 600DPI ) документа и заворачивает эти данные вместе с реквизитами и идентификационными данными (возможно даже использовать рутокены выданные на каждый такой архив) в HTTPS пакет который отправляет методом POST на известный ему адрес ЦЦХД
  3. На ЦЦХД при поступлении такого запроса происходит идентификаци клиента и занесение в ЦЦХД новой записи связывающей полученный цифровой документ с архивом, фондом, опись, делом через полученные реквизиты и идентификационные данные, а так же перемещение цифрового документа в каталог хранилища.
    В результате обработки HTTPS::POST запроса скрипт отправляет HTTPS ответ сканеру который ждёт ответа и принимает решение: либо продолжить сканирование либо повторить и обработать ошибку
  4. Скорее всего придётся создать обработчик очереди запросов, так как скорость сканирования может быть выше скорости обмена по сети и выше скорость обработки данных в ЦЦХД

Вот в принципе и всё

похожие страницы

  1. Пиратская партия россии, что это такое
  2. Абсурд электронного правительства
  3. Геноцид в России
  4. Мошенники россии
  5. Николай II, последний русский царь

#1:

http://colonelcassad.livejournal.com/336729.html

ответить  2011-05-22 17:21:51