На стартовую страницу


Баранов В.А., Вотинцев А.А., Гнутиков Р.М., Зуга О.В., Миронов А.Н., Никифорова С.А., Ощепков С.В.,Рябова Е.В., Романенко В.А. (Ижевск)

СТРУКТУРА И ФУНКЦИИ ИНФОРМАЦИОННО-ПОИСКОВОЙ СИСТЕМЫ "МАНУСКРИПТ" (1)

Исследование любых текстов специалистами различных специальностей (языковедами, историками, культурологами, литературоведами и др.) требует обеспечения оперативного доступа к текстовой информации. Разрабатываемая в УдГУ технология работы с рукописями позволяет автоматизировать ввод, обработку и дает эффективный инструмент для исследования рукописных текстов (информационно-поисковая система "Манускрипт"). ИПС позволяет получить доступ к любой единице текста (например: предложение, слово, знак; временной, авторский и т.п. фрагменты) и ее характеристикам, интересующим исследователя.

87

В основе нашего подхода к представлению рукописного памятника лежит принцип сохранения всех графико-орфографических и структурных характеристик рукописи, долгое время подвергавшихся упрощению в практике издания таких текстов. Особенностями хранения текста в ИПС "Манускрипт" являются: 1) возможность хранения многих текстов в базе данных; 2) декомпозиция (разложение) текста до уровня знаков; 3) разметка текста; 4) ввод и хранение характеристик всех языковых и структурных единиц от уровня знаков до уровня рукописи.

В настоящее время функции ИПС "Манускрипт" с точки зрения пользователя таковы (см. рис 4, арабские цифры):

1. интерактивный ввод текста, языковой и экстралингвистической информации в БД, фрагментация текста и установление связей между выбранными единицами;
2. загрузка (импорт) в БД ИПС древнерусских текстов из других баз данных (набор в текстовом процессоре Chiwriter, хранение в СУБД Paradox);
3. составление условий (критериев) запроса с возможностью выбора типа единиц, их характеристик и связей (в том числе по нескольким текстам!) и получение результатов в заданной форме (выборки, указатели и др.);
4. печать текста или его фрагмента в различных видах и формах (в форме текста или указателя, в упрощенном или близком к оригиналу виде и т.п.), получение оригинал-макета.

Реализация этих функций обеспечивается следующими модулями (см. рис. 4, римские цифры):

I. Серверная модель базы данных, которая обладает универсальной структурой с точки зрения хранения любых единиц и их связей, обеспечивает эффективность выборок и поддерживает необходимые наборы символов (древнерусский, церковнославянский, современный русский, греческий и др. алфавиты).

II. Интерфейс прикладного программирования, реализующий основные функции работы с единицами текста; предоставление интерфейса для вызова этих функций из внешних программ (редактора и др.).

III. Специализированный редактор, имеющий удобный графический интерфейс и обеспечивающий поиск, ввод, фрагментацию и корректировку (редактирование) данных, а также возможность многопользовательского режима работы.

IV. Интерфейсные формы для ввода критериев запроса.

V. Формирование для просмотра и печати оригинал-макета.

88


Рис. 4. Обобщенная структура ИПС "Манускрипт"

89

(1) Работа осуществляется при поддержке РГНФ, грант N

Содержание бюллетеня N30
Информационный бюллетень Ассоциации "История и компьютер"