На стартовую страницу


В.А. Перевертень

МОДЕЛИ ОРГАНИЗАЦИИ ИНФОРМАЦИИ В ИНФОРМАЦИОННЫХ СИСТЕМАХ ДЛЯ ПРОСОПОГРАФИЧЕСКИХ ИССЛЕДОВАНИЙ

Введение

Как отмечают специалисты по применению компьютеров в исторической науке, создание информационных систем для исторических исследований является более сложной и специальной задачей, чем построение традиционных информационных систем1. Разработка таких систем требует решения целого ряда научно-исследовательских и технологических задач, центральное место среди которых занимает задача организации связанной с исследованием информации2 . Историку приходится иметь дело с огромными массивами информации. И только организовав ее соответствующим образом он может уверено оперировать ею.

Слoжность проблемы организации историко-исследовательской информации3 в ее объеме и нестандартности. Разнообразие историко- исследовательской информации обусловлено как самой ее природой, так и особенностями предметной области, которая отображается в этой информации.

Легче структурировать информацию о массовых и однородных объектах и отношениях, значительно сложнее об уникальных и разнородных. К сожалению, в историко-исследова-тельской информации, чаще всего, отражаются заметно изменяющиеся во времени и пространстве социо- культурные системы4 . К таким системам принадлежат и объекты просопографического изучения - человеческие сообщества, состоящие из значительного числа членов и рассматриваемые на протяжении нескольких десятилетий или даже веков.

Массивы информации, с которыми имеет дело историческая наука, характеризуются значительно большим многообразием структур, чем это наблюдается в других науках, например, в естественных. Это "затрудняет для историка простое заимствование методов и инструментария других дисциплин"5 . Требуются специальные модели организации информации, соответствующие специфике исторических исследований вообще и просопографических в частности6 .

По нашему мнению, историко-исследовательская информация должна быть организована так, чтобы обеспечить определенную комфортность, качество и эффективность познавательно-информационной деятельности историка. Организация будет тем лучше, чем больше она будет соответствовать специфике участвующей в историческом исследовании информации и особенностям информационной деятельности историка как исследователя.

В настоящей статье предлагаются формализованные модели организации историко-исследовательской информации в целом и отдельно просопографической информации (понимаемой в узком смысле). Содержательные постановки решаемых задач выглядят следующим образом:

- построить модель организации информации, как вовлекаемой в историческое исследование, так и возникающей в процессе его, которая обеспечивала бы комфортные условия для информационно- познавательной деятельности исследователя, вне зависимости от характера структурированности информационного массива;

- построить модель организации информации, представляющей собой биографические данные об изучаемой группе исторических лиц, которая бы соответствовала специфике формирующегося информационного массива и потребностям просопографических исследований.

Модель гипертекстовой организации историко-исследовательской информации

Ряд работ7 , собственные наблюдения и беседы с коллегами дают основания утверждать, что с информационной точки зрения процесс познания субъектом объекта состоит в накоплении информации фрагментами и объединении и связывании образов (моделей) этих информационных фрагментов.

Фрагмент информации либо вычленяется исследователем из имеющегося в его распоряжении массива информации, либо порождается им самим. В большинстве случаев информационные фрагменты являются многоплановыми по содержанию, не до конца понимаемыми познающим субъектом, поэтому он, как правило, оперирует не самими фрагментами, а их образами. Рассматривая фрагмент по частям и воспринимая его содержание с различных точек зрения, с одним и тем же информационным фрагментом исследователь может связывать множество образов, по разному отражающих этот фрагмент. В качестве образов могут выступать наименования информационного фрагмента, наборы ключевых слов, пиктограммы, библиографические описания, аннотации, рефераты и т.д. Возможны случаи, когда содержание фрагмента и его образ совпадают. Образы информационного фрагмента могут возникать до его реального появления, когда у исследователя еще не сформировалось достаточно четкое и полное содержание информационного фрагмента или он пока еще не выделил этот фрагмент из внешнего информационного массива.

Для борьбы с "проклятием размерности", которое выражается в огромном количестве информационных фрагментов и их образов, накапливающихся в процессе решения исследовательской задачи, применяются такие приемы как декомпозиция и структуризация. Первый прием заключается в объединении образов в некоторые совокупности, исходя из самых произвольных соображений познающего субъекта. Второй прием состоит в связывании образов друг с другом также по воле субъекта.

Исходя из рассмотренного представления об информационной деятельности познающего субъекта, по нашему мнению, наиболее подходящей является гипертекстовая (гипермедиа) организация исследовательской информации вообще и историко-исследовательской в особенности. Гипертекстовый подход наиболее точно отображает логическую структуру памяти человека и его мышление8 . Именно гипертекст позволяет упорядочить в удобном для исследователя виде информацию, которая является неоднородной, зачастую уникальной, которую невозможно формализовать и выделить в ней необходимые для построения баз данных и баз знаний категории, у которой нет априорной, заранее выверенной структуры, с которой исследователь может работать, лишь выделяя в ней фрагменты. Это способ представления как раз неструктурированного, свободно наращиваемого знания9 . Этим он отличается от различного рода моделей данных и моделей представления знаний10 .

Предлагаемая модель гипертекстовой (гипермедиа) организации исследовательской информации несколько отличается от "классического" представления о гипертексте11 . В ее основе лежат следующие понятия: информационный объект (ИО), образ ИО, объект гипертекста (ОГТ), ассоциация и связь.

Информационный объект - это фрагмент информации, который может объективно существовать или порождаться как единица информации, произвольно выделяться из имеющегося информационного массива, формироваться познающим субъектом. Это та часть информации, которая представляет для исследователя интерес как отдельная единица. На содержание, объем, форму представления (текст, аудио, видео или комплексная), структурную организацию (линейный текст, гипертекст, формуляр, книга, база данных, база знаний и т.д.), носитель (бумага, компьютерная среда, мозг человека и др.) информационного фрагмента, понимаемого как информационный объект, не накладывается никаких ограничений. Информационный объект - это собрание сочинений и цитата из какого-нибудь произведения, это кинофильм и кадр из него, это запись речи и отрывок из нее, это исторический источник и выписка из источника, это коллекция анкет и раздел анкеты, это набор фотографий и одна из них.

Образ ИО - это обозначение одного или нескольких аспектов содержания ИО, это некоторые признаки, отражающие содержание ИО, это вторичная информация, являющаяся моделью содержания ИО. Другими словами, это огрубленное отображение тем или иным способом выделенных субъектом сторон содержания ИО. Понятие образа ИО охватывает и понятие знака, и понятие поискового образа документа, и понятие вторичного документа. К примерам образов, приведенным ранее, можно добавить еще ряд: Фамилия И.О. личности, сведения о которой приведены в соответствующей анкете, автор и название исторического источника, реклама кинофильма, фрагмент мелодии, упрощенная схема сложного чертежа.

Образ ИО, дополненный уникальным идентификатором его и указателем на ИО (уникальным идентификатором ИО), к которому этот образ относится, называется объектом гипертекста. ОГТ выступают в качестве узлов гипертекстовой сети и играют роль "представителей" ИО в гипертексте. С одним ИО может быть связано несколько ОГТ (один - первичный, а остальные - вторичные), представляющих его с разных сторон. При такой организации сам ИО, будучи включенным в гипертекст, является пассивным компонентом гипертекста и существует независимо от него. Способ доступа к ИО зависит от его типа и места хранения.

Ассоциациями мы называем группы ОГТ, которые исследователь формирует исходя из объективных свойств образов ИО или своих субъективных соображений. Каждая ассоциация имеет уникальное имя. Для исторических исследований ряд имен ассоциаций имеет смысл задать априори. К именам, входящим в этот круг, относятся, например: "фактис" (факт источника), "фактни" (научно-исторический факт), "внеист" (внеисточнико-вая информация), "идеисм" (собственные мысли исследователя, выводы, предположения), "идеидр" (мысли, выводы, гипотезы, высказанные другими), "обпубл" (ОГТ, ИО которых готовятся к публикации). Остальные имена ассоциаций вводятся в процессе исследования по необходимости. Один и тот же ОГТ может входить в несколько ассоциаций, поэтому ассоциации как совокупности ОГТ в общем случае пересекаются, входят одна в другую.

Под связью в предлагаемой модели гипертекстовой организации информации подразумевается симметричное бинарное отношение, устанавливаемое между двумя ОГТ относительно определенных ассоциаций, в которых связываемые ОГТ находятся. Именно в таком определении связей заключается существенное отличие нашей модели от модели "классического" гипертекста. Из приведенного определения следует, что два ОГТ, будучи связанными в рамках одних ассоциаций, могут быть никак несвязанными относительно других ассоциаций, в которые они оба входят. Вполне допустима связь между ОГТ, ИО которых рассматриваются как объекты публикации, хотя они не связаны как члены, например, ассоциации "собственные идеи". В зависимости от отношения к ассоциациям связи делятся на внутриассоциативные и межассоциативные.

Формально модель гипертекстовой организации информации (HT-модель) можно определить как пару12 :

HT=(HTS, HTP),

где HTS - множество допустимых гипертекстовых структур;

HTP - множество допустимых операций над этими структурами.

Пусть NH - множество идентификаторов ОГТ, IM - множество образов ИО, ID - множество идентификаторов ИО, IO - множество ИО, NA - множество имен ассоциаций. Допустимые гипертекстовые структуры (HTS-структуры) определяются соответствующими отношениями, заданными на перечисленных множествах, и ограничениями целостности. В предлагаемой нами модели HTS-структура - это кортеж:

HTS=(HTO, IDIO, AS, LNK, HTSL),

где HTO - множество ОГТ;

IDIO - отношение "идентификатор ИО - ИО";

AS - отношение ассоциации;

LNK - множество связей;

HTSL - ограничения целостности гипертекстовой структуры.

Множество ОГТ представляет собой отношение, определяемое на множествах NH, IM и ID как HTO*NH*IM*ID, где *1HTO**2,3HTO. Элементами множества HTO являются кортежи (h,img,idn), в которых h * *1HTO, img * *2HTO, idn * *3HTO.

В отношении "идентификатор ИО - ИО", которое связывает множества ID и IO как IDIO*ID*IO, при этом *1IDIO**2IDIO. Элементы IDIO - это пары (idn,inf), где idn О p1IDIO, а inf О p2IDIO.

Отношение ассоциации является подмножеством декартова произведения множеств NH и NA, т.е. AS*NH*NA , элементы которого можно представить парами (h,a), в которых h * *1AS, а a * *2AS. Сечение AS(h) есть множество имен ассоциаций, в которые входит ОГТ с идентификатором h. Другое сечение AS(a) определяет множество ОГТ, входящих в одну и ту же ассоциацию. В множестве NA предусмотрено два особых имени: 'outAS' (вне ассоциаций) и 'noact' (не актуален). Первое имя - это имя ассоциации, в которую все ОГТ автоматически включаются при создании, а второе - используется для выделения совокупности ОГТ, условно считающихся удаленными из гипертекстовой структуры.

Множество связей - это отношение, определенное на множествах NH и NA как LNK*NH*NA*NH*NA, элементы которого представляют собой кортежи вида (h1,a1,h2,a2), где h1,h2 * *1HTO, a1 * AS(h1), a2 * AS(h2), причем h1*h2 и для каждого кортежа в множестве LNK имеется симметричный ему кортеж (h2,a2,h1,a1), чем отражается двунаправленность связей. Если связь - внутриассоциативная, то a1=a2, а если - межассоциативная, то a1*a2.

Начальное состояние HTS-структуры соответствует утверждению: HTO=* & IDIO=* & AS=* & LNK=*. В состояниях, отличных от начального, она должна удовлетворять ограничениям целостности HTSL, которые заключаются в следующем утверждении: p1IDIO=p3HTO & p1AS= p1HTO & p1,2LNKНAS.

Интересны два частных случая (состояния) HTS-структуры:
1) Если для всех h * *1HTO AS(h)={'outAS'}, то это структура без ассоциаций со связями вне ассоциаций.
2) Когда LNK=* и cуществуют h * *1HTO, для которых AS(h)*{'outAS'}, тогда имеем структуру без связей между ОГТ, которые (все или часть) объединены лишь в ассоциации.

Множество операций HTP, допустимых над определенными выше гипертекстовыми структурами, состоит из 15 операций трех типов:
- операции формирования гипертекста;
- операции выборки элементов гипертекстовой структуры;
- операции выделения части гипертекстовой структуры в соответствии с заданными условиями.

Набором операций формирования гипертекста определяются возможные изменения состояния HTS-структуры. В нашей модели предусмотрено пять операций этого типа:
- INIT_HTS (операция инициализации HTS-структуры);
- ADD_PRM_HTO (операция создания первичного ОГТ);
- ADD_SEC_HTO (операция создания вторичного ОГТ);
- ADD_AS (операция включения ОГТ в ассоциацию);
- ADD_LNK (операция связывания ОГТ).

Легко заметить, что в приведенном перечне отсутствуют операции по удалению из HTS-структуры ее элементов. Мы полагаем, что однажды включенные в гипертекст ИО и отношения, установленные между ОГТ, сохраняют свою потенциальную ценность до конца исследования. Тем не менее, если необходимо, имеется возможность временного исключения некоторых ОГТ из рассмотрения путем включения их в особую ассоциацию 'noact'.

Операции выборки элементов гипертекстовой структуры предназначены для отбора тех ее элементов, с участием которых будут выполняться некоторые операции или которые будут просто просматриваться либо редактироваться. Таких операций шесть:
- ACCESS_NH_HTO (операция выборки ОГТ по его идентификатору);
- ACCESS_IM_HTO (операция выборки ОГТ по образу ИО);
- ACCESS_HTO_AS (операция выдачи списка имен ассоциаций, в которые входит указанный ОГТ);
- ACCESS_HTO_LNK (операция выдачи списка связей между двумя указанными ОГТ);
- ACCESS_IO (операция доступа к ИО через один из связанных с ним ОГТ);
- ACCESS_INCID_HTO (операция выборки всех ОГТ смежных указанному ОГТ).

Все перечисленные выше операции, кроме операции инициализации, могут выполняться как над полной HTS-структурой, так и ее частью, выделенной в соответствии с заданными условиями.

Для выделения части гипертекстовой структуры, ОГТ, ассоциации и связи которой удовлетворяют заданным условиям, необходимо:
1) Отобрать ОГТ, удовлетворяющие заданным условиям;
2) Отобрать элементы отношения ассоциации согласно условиям;
3) Отобрать связи, удовлетворяющие заданным условиям;
4) Из отобранных ОГТ оставить те, которые входят в заданные ассоциации;
5) В отношении ассоциации оставить лишь элементы, которые соответствуют оставшимся ОГТ;
6) Среди отобранной совокупности связей оставить только те, оба конца которых инцедентны отобраным ОГТ в рамках заданных ассоциаций.

Выделение части гипертекстовой структуры в соответствии с заданными условиями осуществляется с помощью следующих операций:
- SELECT_HTO_HTS (операция выделения части HTS-структуры по условиям, заданным только для ОГТ);
- SELECT_AS_HTS (операция выделения части HTS-структуры по условиям, заданным только для ассоциаций);
- SELECT_LNK_HTS (операция выделения части HTS-структуры по условиям, заданным только для связей);
- SELECT_CMPLX_HTS (операция выделения части HTS-структуры по комплексным условиям).

Семантика перечисленных операций заключается в следующем:

Операции формирования гипертекста:

Операция INIT_HTS. Создает пустую гипертекстовую структуру. Операция ADD_PRM_HTO. Создает ОГТ для ИО, который впервые включается в гипертекстовую структуру. При этом должна быть обеспечена уникальность идентификаторов ОГТ и ИО. Созданный ОГТ автоматически включается в ассоциацию с именем 'outAS'.

Операция ADD_SEC_HTO. Создает вторичный ОГТ для ИО, который уже включен в гипертекстовую структуру. Вторичный ОГТ создается на базе одного из существующих ОГТ для данного ИО. При этом идентификатор нового ОГТ должен отличаться от идентификаторов имеющейся совокупности ОГТ, образ отличаться от образа базового ОГТ, а идентификатор ИО берется из базового ОГТ. Созданный вторичный ОГТ также автоматически включается в ассоциацию с именем 'outAS'.

Операция ADD_ AS. Включает указанный идентификатором ОГТ в заданную ассоциацию. При этом не допускается повторное включение ОГТ в ассоциации, в которых он уже находится.

Операция ADD_LNK. Создает двунаправленную связь между указанными идентификаторами ОГТ в рамках заданных ассоциаций. При этом два ОГТ могут связываться лишь в рамках тех ассоциаций, в которые они уже включены, не допускается повторное связывание ОГТ относительно тех же самых ассоциаций и запрещено связывание ОГТ с самим собой.

Операции выборки элементов гипертекстовой структуры:

Операция ACCESS_NH_HTO. Находит и выдает ОГТ по заданному идентификатору. Если ОГТ с указанным идентификатором отсутствует, то результат - ПУСТО.

Операция ACCESS_IM_HTO. Находит и выдает совокупность ОГТ с заданным образом ИО. Если ОГТ с указанным образом ИО отсутствуют, то результат - ПУСТО.

Операция ACCESS_HTO_AS. Выдает совокупность имен ассоциаций, в которые входит ОГТ с заданным идентификатором. Если ОГТ с указанным идентификатором отсутствует, то результат - ПУСТО.

Операция ACCESS_HTO_LNK. Выдает совокупность связей между двумя ОГТ, которые указаны их идентификаторами. Если эти ОГТ никак не связаны, то результат - ПУСТО.

Операция ACCESS_IO. Осуществляет доступ к ИО через связанный с ним ОГТ, который указан идентификатором. Если ОГТ с заданным идентификатором отсутствует, то результат - ПУСТО.

Операция ACCESS_INCID_HTO. Выдает совокупность ОГТ смежных ОГТ, который указан идентификатором. Если этот ОГТ не имеет ни одного смежного ОГТ, то результат - ПУСТО.

Операции выделения части гипертекстовой структуры:

Операция SELECT_HTO_HTS. Выдает часть гипертекстовой структуры согласно условиям, заданным только для множества ОГТ. Если эти условия таковы, что им не соответствует ни один элемент множества ОГТ, то результат - ПУСТО.

Операция SELECT_AS_HTS. Выдает часть гипертекстовой структуры согласно условиям, заданным только для отношения ассоциации. Если эти условия таковы, что им не соответствует ни один элемент отношения, то результат - ПУСТО.

Операция SELECT_LNK_HTS. Выдает часть гипертекстовой структуры согласно условиям, заданным только для множества связей. Если эти условия таковы, что им не соответствует ни один элемент множества связей, то результат - исходная гипертекстовая структура, но без связей.

Операция SELECT_CMPLX_HTS. Выдает часть гипертекстовой структуры согласно условиям, заданным для множества ОГТ, отношения ассоциации и множества связей. Если эти условия такие, что им не соответствует ни один элемент множества ОГТ либо ни один элемент отношения ассоциации, то результат - ПУСТО.

Модель анкетной организации просопографической информации

Из бесконечного множества характеристик, которые могут быть связаны с каждым из членов группы лиц (социума), исследователь выделяет лишь некоторое конечное подмножество в соответствии с отражаемыми аспектами и поставленными исследовательскими задачами. Самый простой случай наблюдается, когда все персоналии социума описываются одинаковыми наборами характеристик. В общем же случае, каждая персоналия представляется своей совокупностью характеристик, в зависимости от того, к какому контингенту она относится и с каким отрезком времени из изучаемого периода соотносится ее жизненный путь. Например, очевидно, что невозможно отобразить одним и тем же набором характеристик аспект образования для российского историка-любителя начала XVIII века и для историка - преподавателя Московского университета в конце XIX века. Все характеристики членов неоднородного социума можно разделить на 3 группы:
- массовые, которые являются общими для всех представителей социума;
- ограниченно-массовые, являющиеся общими только для определенных подсоциумов исследуемого социума;
- уникальные, которые относятся лишь к отдельным входящим в социум персоналиям.

По нашему мнению, наиболее естественным по отношению к восприятию историков представлением сведений о персоналиях является форма типа анкеты. Под анкетой мы подразумеваем иерахическую структуру, состоящую из разделов и пунктов. Раздел - это совокупность разделов и/или пунктов. Каждый раздел имеет уникальный идентификатор и одно или более наименований. В понятие пункта входит уникальный идентификатор, минимум одно наименование и одно или несколько значений. Пункт может входить только в один из разделов. Раздел также может входить лишь в один раздел. Единственный раздел, который не входит ни в какой другой раздел является особым разделом, представляющим собой собственно анкету. Идентификатор этого раздела - это идентификатор анкеты, а наименования - имена анкеты.

Но обычная анкета с жесткой структурой не вполне подходит для неоднородного социума из-за нерегулярности наборов характеристик его членов. Использование анкеты со структурой общей для всех членов социума ведет к различного рода неопределенностям13 в значениях характеристик, которых наблюдается тем больше, чем больше неоднородность социума.

Возможны два подхода к решению этой проблемы:
1) Декомпозиция социума на однородные (или близкие к этому) подсоциумы и создание анкет со структурой отдельной для каждого из выделенных подсоциумов;
2) Применение анкет с вариантной структурой, которая настраивается отдельно для каждой персоналии. Говоря более конкретно, анкета с вариантной структурой отличается от обычной тем, что ряд ее разделов и пунктов входят в другие разделы в зависимости от выполнения определенных условий.

При традиционной так называемой "карандашно-бумажной" технологии применяется первый подход. Компьютерные технологии позволяют реализовать и второй подход, который является более соответствующим специфике просопографических исследований, требующих интегрированной и единообразной организации информации.

Схема анкет с вариантной структурой формально представляется парой:

sch=(NDS, CHLNK),

где NDS - множество узлов; CHLNK - множество связей.

Узел соответствует разделу или пункту анкеты. Множество NDS состоит из узлов трех типов: узла-анкеты, узлов-разделов и узлов-пунктов. Точнее говоря, NDS=QNDИDNDSИPNDS & QNDЗDNDSЗPNDS=*, где QND - узел- анкета; DNDS - множество узлов-разделов; PNDS - множество узлов- пунктов.

Под каждым из подмножеств множества NDS подразумеваются соответствующие отношения:
QNDНnd0?DN0;
DNDSНND?DN;
PNDSНNP?PN?VL,
где nd0 - идентификатор узла-анкеты;
DN0 - множество имен анкеты;
ND - множество идентификаторов узлов-разделов;
DN - множество наименований разделов;
NP - множество идентификаторов узлов-пунктов;
PN - множество наименований пунктов;
VL - множество значений пунктов.

Множество CHLNK определяет возможные структуры анкет и является отношением CHLNKНNND?NND?CND, удовлетворяющем утверждению p2CHLNKRp1,3CHLNK & nd0=p1CHLNK\ p2CHLNK & p1DNDS = p1CHLNKЗp2CHLNK & p1PNDS = p2CHLNK\p1CHLNK, которое отражает иерархичность структур. В рассмотренном отношении NND - это множество идентификаторов узлов принадлежащих множеству NDS, т.е. NND=nd0Иp1DNDSИp1PNDS & nd0Зp1DNDSЗp1PNDS=*, а CND - множество предикатов (условий) существования связей между узлами.

Для более полного и точного относительно средств реализации и простого и естественного для историков определения схемы анкет с вариантной структурой лучше воспользоваться специально разработанными для этого средствами формализованного описания в виде инфологической модели (ИЛМ)14 .

В качестве модели организации просопографической информации предлагается т.н. анкетная группа (QG-модель), которая формально представляется парой:

QG=(QGS, QGP),

где QGS - множество допустимых структур анкетной группы; QGP - множество допустимых операций над этими структурами.

Допустимая структура анкетной группы (QGS-структура) - это отношение:

QGSНNQ?sch?CTFVsch?AQ,

где NQ - множество идентификаторов анкет; sch - схема анкет с вариантной структурой;
CTFVsch - множество векторов истинности условий существования связей для схемы sch;
AQ - множество признаков активности анкет.

Каждой анкете соответствует кортеж (n,sch,tfv,a), в котором n О p1QGS, tfv О p3QGS, a О p4QGS и p1QGSRp2,3,4QGS. Пара (sch,tfv) отражает структуру анкеты с идентификатором n.

В зависимости от значения признака активности a анкетная группа делится на два подмножества: QGSA (подмножество активных анкет), если a="act" и QGSP (подмножество неактуальных анкет), если a="noact". Для QGSA и QGSP справедливо утверждение QGS=QGSAИQGSP & QGSAЗQGSP=*. Признак активности анкет используется для выделения совокупности анкет, которые считаются условно удаленными из анкетной группы.

QGS=* соответствует пустой QGS-структуре.
Множество операций QGP, допустимых над QGS-структурой, состоит из 9 операций трех типов:
- операция генерации рабочей схемы анкет;
- операции формирования анкетной группы;
- операции отбора анкет и доступа к анкетам, к их разделам и пунктам.

Операция генерации рабочей схемы анкет GEN_SCH формирует внутреннее формальное представление текущей (рабочей) схемы анкет с вариантной структурой на основании ИЛМ социума, представленной с помощью упомянутого выше языка.

Набором операций формирования анкетной группы определяются возможные изменения состояния QGS-структуры. В предлагаемой модели предусмотрено пять операций этого типа:
- INIT_QGS (операция инициализации QGS-структуры);
- ADD_QSTN (операция создания новой анкеты);
- MODI_STRU_QSTN (операция модификации структуры анкеты);
- NOACTIV_QSTN (операция условного удаления анкеты);
- REACTIV_QSTN (операция восстановления анкеты из числа условно удаленных).

Операций отбора и доступа предусмотрено три:
- SELECT_QSTNS (операция отбора анкет по заданным условиям);
- ACCESS_QSTN (операция доступа к анкете по ее идентификатору);
- ACCESS_DVS/PNT (операция доступа к разделу/пункту анкеты по его идентификатору).

Семантика перечисленных операций заключается в следующем:

Операция генерации рабочей схемы анкет:
Операция GEN_SCH. Генерирует рабочую схему анкет с вариантной структурой по текущей версии ИЛМ.

Операции формирования анкетной группы:

Операция INIT_QGS. Создает пустую QGS-структуру.
Операция MODI_STRU_QSTN. Модифицирует структуру указанной идентификатором анкеты в соответствии с обновленной рабочей схемой анкет с вариантной структурой и значениями вектора истинности условий существования связей, сохраняя при этом признак активности анкеты.
Операция NOACTIV_QSTN. Переводит указанную идентификатором анкету в разряд неактивных (неактуальных или условно удаленных). Если анкета с заданным идентификатором отсутствует в анкетной группе, то результат - ПУСТО.
Операция REACTIV_QSTN. Переводит указанную идентификатором анкету из совокупности неактуальных в число активных. Если анкета с заданным идентификатором отсутствует в анкетной группе, то результат - ПУСТО.

Операции отбора и доступа:

Операция SELECT_QSTNS. Осуществляет отбор анкет из совокупности активных, удовлетворяющих заданным условиям. Если условия таковы, что им не соответствует ни одна активная анкета, то результат - ПУСТО.
Операция ACCESS_QSTN. Осуществляет доступ к анкете с заданным идентификатором. Если анкета с указанным идентификатором отсутствует в анкетной группе, то результат - ПУСТО.
Операция ACCESS_DVS/PNT. Осуществляет доступ к указанному идентификатором разделу/пункту избранной анкеты с целью просмотра его имени, а для пункта еще и с целью его заполнения или редактирования. Если раздел/пункт с заданным идентификатором отсутствует в анкете, то результат - ПУСТО.

Рассмотренную модель организации просопографической информации условно можно назвать как "анкетная группа, состоящая из анкет с модифицируемой вариантной структурой".

Заключение

Примером информационной системы для просопографических исследований, в которой организация информации основывается на представленных выше моделях, может служить созданная автором в 1993-1995 гг. система "Просис"15 . В системе предусмотрено хранение представленной в текстовой и графической форме как сильно, так и слабо структурированной информации. В центре организации сильно структурированной информации находится группа анкет историков. Основой части информационной среды, которая служит для хранения слабо структурированной информации, является гипертекстовая организация данных. Реализованная в "Просис" гипертекстовая модель позволяет обеспечить интеграцию слабо структурированной информации с сильно структурированной и дополнительные возможности связывания сильно структурированных информационных единиц. Благодаря такой организации информации, система "Просис" обеспечивает широкие возможности и комфортные условия как для поиска данных, так и для их аналитической обработки.

1 См. Интервью с д-ром Леном Брере, генеральным секретарем Международной Ассоциации "History and Computing" (AHC) // Информационный бюллетень Комиссии по применению математических методов и ЭВМ в исторических исследованиях при отделении истории РАН и ассоциации "История и компьютер". 1993. N 8.

2 Под организацией информации мы подразумеваем разбиение ее на части, построение определенных информационных структур и установление наборов операций над этими структурами вместе с правилами их выполнения.

3 С целью выделения информации, связанной с процессом исторического познания среди социальной информации, вводится понятие историко-исследовательской информации, под которой подразумевается вся информация, используемая или появляющаяся в процессе исторического исследования. (См.: Перевертень В.А. Понятие информации в историческом исследовании // Информационный бюллетень Ассоциации "История и компьютер". 1995 г. N 14. М., 1995. С. 17-20.). Разновидностью историко- исследовательской информации является просопографическая информация. В широком смысле под просопографической информацией мы понимаем всю информацию, тем или иным образом связанную с просопографическим исследованием, а в узком - лишь ту ее часть, в которой отражены динамические и статические характеристики изучаемой группы лиц (см.: Гарскова И.М. "От просопографии к статистике": методика анализа баз данных по источникам, содержащим динамическую информацию // Информационный бюллетень Ассоциации "История и компьютер". 1995 г. N 14. М., 1995.).

4 Гарскова И.М. Некоторые тенденции и проблемы технологии баз данных в исторических исследованиях // Круг идей: развитие исторической информатики. Труды II конференции Ассоциации "История и компьютер". М., 1995.

5 Шпренгнагель Г. Сочетание подходов: компьютерные технологии в истории, квантификация, устная история, историческая семиология и "визуальная история" (опыт Зальцбургской Летней Школы) // История и компьютер: новые информационные технологии в историчеcких исследованиях и образовании / Под ред. Л. Бородкина и В. Леверманна. Scripta Mercaturae Verlag, St. Katharinen, 1993.

6 Гарскова И.М. Базы и банки данных в исторических исследованиях. Gцttingen, 1994.

7 Дробижев В.З. Введение в изучение истории советского общества. М., 1983; Санцевич А.В. Методика исторического исследования. 2-е изд. Киев, 1990; Психологический словарь. М., 1983; Шапиро Э.Л. Знания о мире и их информационные модели // НТИ. Серия 2. 1989. N 9; Соломатин Н.М. Информационные семантические системы. М., 1989.

8 Сидоров Н.А. Гипертекстовая система - новый инструмент программной инженерии // УСиМ. 1993. N 4.

9 Субботин М.М. Новая информационная технология: создание и обработка гипертекстов // НТИ. Серия 2. 1988. N 5.

10 Цикритзис Д., Лоховски Ф. Модели данных. М., 1985; Уэно Х., Исидзука М. Представление и использование знаний. М., 1989.

11 Shneiderman B., Kearsley G. Hypertext Hands-On!: An Introduction to a New Way of Organizing and Accessing Information. Addison-Wesley Publishing Company, 1989.

12 Здесь и далее используются общепринятые в дискретной математике обозначения.

13 Мейер Д. Теория реляционных баз данных. М., 1987; Цаленко М.Ш. Моделирование семантики в базах данных. М., 1989.

14 Автором этой статьи разработан язык инфологического моделирования, который ориентирован, с одной стороны, на предметную область - человеческий социум, а с другой - на отображение на модели данных реляционного типа. В основе построения этого языка лежат теоретико-методологические концепции, изложенные в работах О.М. Вейнерова (см.: Вейнеров О.М., Самохвалов Э.Н. Проектирование баз данных САПР. М., 1990.). Описание языка планируется опубликовать в одном из номеров Информационного бюллетеня Ассоциации "История и компьютер".

15 Гутнов Д.А., Перевертень В.А. Российские историки XVIII - начала XX вв.: проект и информационная система // Круг идей: новое в исторической информатике. Труды I конференции Ассоциации "История и компьютер". М., 1994. С. 39-50; Гутнов Д.А., Перевертень В.А. Просопографическая информационная система "Просис": версия 2.0 // Информационный бюллетень Ассоциации "История и компьютер". 1994 г. N 10. М., 1994. С. 17-18.


Содержание
Издания Ассоциации "История и компьютер"