На стартовую страницу


С.В. РАЗИНКОВ

БАЗА ДАННЫХ "СОВЕТСКИЕ НЕМЦЫ - ТРУДАРМЕЙЦЫ ТАГИЛЛАГА": ПРИНЦИПЫ СОЗДАНИЯ, ИСТОЧНИКИ И МЕТОДЫ ОБРАБОТКИ

В настоящее время тема репрессий по отношению к советским немцам в период Великой Отечественной войны активно разрабатывается историками, использующими в своих работах, прежде всего, документы центральных архивов (ГАРФ, РЦХИДНИ)( 1). Однако нельзя не согла-ситься с авторами одной из таких монографий в том, что "всестороннее исследова-ние проблем военизированных формирований из советских немцев было бы неполным без использования материалов, хранящихся в республиканских, краевых и областных архивах, в фондах предприятий, использовавших труд мобилизованных немцев"( 2).

В Муниципальном архиве г. Н. Тагила находятся ранее недос-тупные для исследователей документы, содержащие интереснейшую информацию о со-ставе, социальном положении, условиях жизни и труда советских немцев - трудар-мейцев: учетные карточки, личные дела умерших трудармейцев и приказы администра-ции двух крупнейших в Свердловской области лагерных образований - Тагиллага и Богословлага в период с 1941 по 1946 г.

200

Взятые в комплексе с другими материалами, характеризующими жиз-ненные пути бывших трудармейцев Тагиллага после 1946 г.( 3), эти источники почти идеально подходят для просопографических ис-следований, т.е. характеристики существенных черт определенных групп населения (в данном случае советских немцев) на основе анализа (в динамике) индивидуальных биографических данных их представителей( 4).

Как первый шаг к этой цели в январе-июне 2000 г. под руко-водством д.и.н. В.М. Кириллова в Нижнетагильском педагогическом институте (НТГПИ) на основе учетных карточек трудармейцев была создана база данных "Совет-ские немцы - трудармейцы Тагиллага".

Информацию, содержащуюся в учетной карточке трудармейца (см. рис. 1), можно разделить на два блока (до и после мобилизации): в первом содержатся данные, характеризующие происхождение и социальный статус трудармейца (ФИО, возраст, место рождения и жительства до мобилизации, образование и т.д.); во втором - информация о его мобилизации и пребывании в Тагиллаге.

Особенности источника - стабильность по составу документов, преемственность в содержании и форме, высокая степень структурированности позво-лили поместить всю информацию учетной карточки в рамки стандартной реляционной СУБД (был выбран пакет MS Access).

Рис.1. Внешний вид учетной карточки трудармейца (лицевая и обо-ротная сторона).

С целью максимального структурного и текстового соответст-вия источника и его электронной копии мы еще на этапе проектирования базы данных (БД) отказались от разработки унифицированной анкеты трудармейца, избрав путь полного переноса всей информации источника в БД.

201

Структура базы данных (см. рис. 2), вклю-чает 2 таблицы и 37 полей, содержащих не только основные персональные характери-стики (ФИО, возраст, пол), но и информацию о месте рождения, роде занятий, уров-не образования, социальной принадлежности и социальном происхождении, а также сведения о перемещениях трудармейца и видах выполняемых им работ.

Рис. 2. Структура базы данных "Советские немцы - трудармейцы Та-гиллага" и ее связи с внешними БД.

Сокращения: К - в поле содержится код признака, значения кото-рого находятся в отдельных таблицах (на схеме не показаны); Т - текстовое поле; Д - в поле содержится дата; Ч - числовое поле.

202

Принципы формирования описываемой БД, впрочем, как и большинства реляционных источнико-ориентированных баз данных (не-зависимо от типа источника)( 5), предусматри-вают: точное воспроизведение содержания источника, кодирование качественных при-знаков, возможность агрегирования данных с определенной корректировкой, возмож-ности по поиску и анализу данных.

Среди последних в рамках базы данных реализованы простейшие методы математико-статистического анализа, а также графическое представление данных.

Модуль, написанный на языке программирования Visual Basic с использованием средств SQL (язык управления реляционными базами данных), позво-ляет создание разнообразных запросов путем комбинации выборок по 22 признакам (см. рис. 3), с последующим графическим представлением результатов выборки.

Рис. 3. Форма для выборок.

Выборки применялись, например, для того, чтобы выделить за-писи, относящиеся к трудмобилизованным советским немцам (из 7353 человек, числя-щихся в картотеке трудармейцев Тагиллага, большая часть являлась именно совет-скими немцами, но кроме них в картотеке и БД представлены интернированные немцы из Германии, репатриированные советские граждане, а также трудармейцы других на-циональностей). Следующий простейший алгоритм выборки позволил "отслоить" все остальные категории, кроме советских немцев:

203

    Национальность = немец
    N личного дела <> Null
    Подданство = СССР

    Кем мобилизован <> Null

    Более сложные алгоритмы связаны с построением динамических рядов, хотя возможности анализа динамических рядов в БД ограничены "их графиче-ским представлением и словесным описанием их положительных и отрицательных пи-ков"( 6) - отсутствуют какие-либо способы сглаживания, хотя возможен выбор временного интервала (шкалы и границ периода). Тем не менее, подобная процедура позволила установить численность немцев-трудармейцев Тагиллага в определенные временные периоды и соотнести получившиеся цифры со сведениями ГАРФ (Ф.9414 "Главное управление лагерей НКВД СССР"), приво-димыми в большинстве работ отечественных исследователей( 7).

    ТАБЛИЦА 1

    Численности немцев-трудармейцев Тагиллага

     по данным ГАРФпо данным БДразница, в %
    на 31 декабря 194237173527- 5,1
    на 1 мая 194333123140- 5,2
    на 1 января 194448254532- 6,0
    на 31 декабря 194445004458- 0,9

    Таким образом, данные БД в целом сравнимы с материалами ГАРФ, что может служить подтверждением достоверности первых, при этом некоторое расхождение в цифрах объясняется, вероятно, тем, что в материалах ГАРФ к совет-ским немцам-трудармейцам отнесена часть трудармейцев других национальностей, а в БД у некоторых персоналий отсутствуют даты прибытия и убытия.

    Более интересен вопрос об общей численности советских нем-цев-трудармейцев, прошедших через Тагиллаг. Часть исследователей вообще предпо-читает уклониться от такого рода оценки( 8), а другие называют цифру от 10196( 9) до 15 тыс.( 10) человек.

204

Выборка в БД по вышеприведенному алгоритму позволяет оценить численность немцев-трудармейцев Тагиллага в 6619 человек( 11). Возможно, что реальная цифра несколько выше (в силу того, что к советским немцам, вероятно, можно отнести часть трудармейцев другой национально-сти), но в любом случае не превышает 6800 человек.

Как пример анализа информации БД можно привести агрегиро-ванные сведения об образовательном уровне трудармейцев, тем более что их соотне-сение с материалами переписи 1939 года может привести к некоторым интересным вы-водам (см. таблицы 2 и 3).

ТАБЛИЦА 2

Распределение немцев-трудармейцев Тагиллага по уровню образова-ния, чел.

 Муж.%Жен.%Всего%
высшее1522,960,81582,7
среднее законченное96318,615720,1112018,8
среднее незаконченное83816,220125,7103917,4
низшее (начальное)230344,532741,8263044,1
малограмотный60611,7364,664210,8
неграмотный3156,1557,03706,2
итого5177100,0782100,05959100,0
нет данных462 201 663 
Всего5638 983 6621 

Таблица 3 иллюстрирует, что у 20-50-летних немцев-трудармейцев Тагиллага оказался значительно более высокий образовательный уро-вень, чем можно было бы ожидать, основываясь на материалах переписи 1939 г. для немцев РСФСР того же возраста( 12).

205

Сравнительно небольшое расхождение в уров-не среднего образования увеличивается, если учесть, что при переписи населения 1939 г. в число лиц со средним образованием попадали и лица и с неполным средним образованием (7 классов), в то время как в БД - только с законченным средним (9 классов).

ТАБЛИЦА 3

Количество лиц, имеющих высшее и среднее образование, на 1000 чел. Сравнение информации БД и данных переписи 1939 года

 Лица немецкой национальности 20-50 лет, проживавшие в РСФСР
(по материалам переписи 1939 г.) ( 13)
Трудмобилизованные Тагилла-га
20-50 лет
(по материалам базы данных)
 Муж.Жен.ВсегоМуж.Жен.Всего
высшее15,76,011,034,310,631,5
Среднее( 14)123,489,9105,3161,2134,8158,1

Такое несоответствие можно попытаться объяснить либо недос-товерностью материалов переписи 1939 г. для АССР НП (уровень фальсификации пере-писи по АССР немцев Поволжья выше, чем в каком-либо другом регионе РСФСР - 9,6%( 15)), либо, что более вероятно, специ-фикой состава трудармейцев Тагиллага.

В БД предусмотрена возможность графического отображения ин-формации (в том числе результатов выборки) о поле, возрасте, социальном происхо-ждении, партийности, национальности, образовании, профессии, дате мобилизации, объекте работы, причине и дате убытия трудармейцев (примеры см. на рис. 4).

В основном графически отображались уже агрегированные зна-чения признаков, при этом наибольшие сложности возникли с агрегированием профес-сий. Нельзя не согласиться с И.М. Гарсковой в том, что "при создании и использо-вании кодов естественно воспользоваться иерархической схемой классификации про-фессий, которая далеко не однозначна"( 16). В нашем случае за основу была взята классификация профессий по словарю переписи 1939 г., подвергнутая некоторой группировке( 17).

206

Рис. 4. Примеры графического отображения информации БД.

Распределение по национальности (1), социальному происхождению (2), причине убытия (3) и профессии (4).

Особенностью базы данных "Советские немцы - трудармейцы Та-гиллага" является возможность локализации информации БД на географической карте, обеспечивающая, по терминологии М. Таллера, "доступ через графический обзор"( 18).

207

Однако, прежде возникла необходимость кор-рекции искаженных географических названий. Решение проблемы можно представить как частный случай процедуры связывания записей (record linkage) - поиск соот-ветствующих записям из исходной базы данных записей в эталонной базе данных ("Регион"). Внешняя база данных "Регион" содержит список географических и адми-нистративно-территориальных единиц СССР и Российской империи: областей и губер-ний (282 записи), районов (4056) и уездов (669), городов областного (426) и рай-онного подчинения (1412), районных центров, а также отдельных населенных пунк-тов, в основном на территории АССР немцев Поволжья (248), Ленинградской обл. (945) и Тагильского округа Уральской области (1779).

Круг источников БД "Регион" достаточно разнообразен( 19), однако наиболее перспективным источником с нашей точки зрения являются "Списки населенных пунктов", изданные по материа-лам переписи населения 1926 г. и "поселенной" переписи 1927 г.( 20), которые в нашем случае привлекались для характеристики селений Тагильского округа. В перспективе планируется включить в БД "Регион" список населенных пунктов всех 19 округов Уральской области РСФСР (около 40000), соотнеся его со списком населенных мест Пермской губернии Российской империи (более 14000).

Функция коррекции подразумевает использование внешней БД "Регион" не только в качестве справочной, но и некоей экспертной системы, где в качестве решателя проблем выступает модуль Geo Analyzer (реализован на языке VisualBasic), в котором использованы следующие поисковые процедуры и критерии для связывания записей (расположены по степени достоверности получаемого резуль-тата):

    1. полное совпадение (ПС) полей, содержащих название области, района или населенного пункта в исходной и эталонной БД;

    2. пропуск символа, замена или лишний символ (ПЗЛ-1) - ве-дет к устранению незначительных помех посредством т.н. Guth-алгоритма( 21);

208

3. частичное совпадение (ЧС) записей исходной БД с эталоном (напр.: Орджоник. обл.=Орджоникидзевский край);

4. поиск по ключевым словам (КЛ), таким как АССР, губ., район и т.д. - применяется для анализа сокращений (ТАССР=Татарская АССР);

5. "скользящий поиск" (СП), совпадение только части содер-жимого полей, как в исходной БД, так и в БД "Регион" (Коб.-Балкарская ССР=Кабардино-Балкарская АССР);

6. алгоритмы, основанные на применении Soundex-кода (SC)( 22) - используют две группы рабочих предполо-жений - для искажений произношения и для искажений написания;

7. частичное совпадение Soundex-Code (SC-ЧС) - комбинация SC и ПЗЛ-1 для резко ограниченного набора записей (например, районов области, число которых редко превышает 50);

8. поиск без учета области (ПБО);

9. поиск без учета района (ПБР).

Два последних алгоритма применяются, чтобы отойти от иерар-хической структуры БД "Регион" для идентификации ошибочно указанных объектов на верхних уровнях (область, район).

Чем неоднозначнее результат применения процедуры, тем более ее работа ограничена набором условий. Например, при применении Soundex-кода не-изменными остаются два-три первых символа сравниваемых строк, так же как и поло-жение гласных букв (изменение которых возможно лишь в рамках фонетически близких пар а-о, е-и и т.д.). Авторы сознательно отказались от максимального использова-ния возможностей мощных поисковых процедур (SC, SC-ЧС) для уменьшения числа не-правильно идентифицированных записей. Эффективность используемых процедур связы-вания записей (см. рис. 5) достаточно высока, несмотря на далеко неполный пере-чень населенных пунктов в эталонной БД и скромные возможности по анализу измене-ний в территориальном делении (для чего применяются таблицы совместимости облас-тей и районов).

Следующим шагом является непосредственная локализация ин-формации БД на географической карте. В отличие от специализи-рованных исследова-ний по пространственному анализу( 23) мы от-казались от использования ГИС по целому ряду причин (специфика исследовательских задач, скромная техническая и программная оснащенность и т.д.), что сразу же сделало основным объектом анализа не регион, а географическую точку (населенный пункт). Работа модуля Map Viewer состоит из двух этапов (см. рис. 6).

209

На первом этапе информация из БД "Регион" (полный список насе-ленных пунктов, либо ограниченный с помощью запроса по численности населения или административной принадлежности) размещаются на картооснове (в этом качестве вы-ступает обычный графический файл). На втором этапе список названий населенных пунктов комбинируется с итоговым запросом SQL исходной базы данных, а результат размещается на карте.

Рис. 5. Алгоритм и результат корректировки географических назва-ний с помощью внешней БД "Регион".

Сокращения: Ит - количество записей в исходной БД; Эо - количе-ство записей идентифицированных экспертом по материалам БД "Регион"; Н - количе-ство записей, скорректированных программой; О - количество ошибочно идентифици-рованных записей.

Далее на рис.6 приводится схема локализации информации БД на географической карте: 6а) Картооснова с рельефом местности; 6б) Размещение на карте географических точек (населенных пунктов); 6в) Поиск соответствующей ин-формации в БД и привязка ее к географическим пунктам.

210


Названиев.д.с.ш. Названиекол-во
Бауэр45.24.250.54.4 Бауэр30
Гримм43.30.050.52.7 Гримм19
Францозен45.29.050.46.4 Францозен3
................ . ..... . ..... . . .... . . .... . .

Рис. 6. Пример отображения информации БД на географической кар-те.

Фрагмент карты АССР Немцев Поволжья с информацией о месте рож-дения трудармейцев (после наименования населенного пункта указано количество ро-дившихся там трудармейцев).

Таким образом, описанная база данных может быть использова-на для характеристики социального портрета, а в рамках более обширных банков данных и для изучения "жизненных путей" советских немцев на примере трудармейцев Тагиллага.

211

( 1) Подробный историографический анализ работ, источников и подходов к исследованию данной тематики см.: Чернова Т. Проблема политических репрессий в отношении немецкого населения СССР (обзор отечественной историографии) // Репрессии против российских немцев. Наказанный народ. Сборник трудов конференции "Репрессии против немцев в Советском Союзе в контексте современной национальной политики". М.: Звенья, 1999. С.261-278.
( 2) Герман А.А., Курочкин А.Н. Немцы СССР в трудовой армии (1941-1945). М.: Готика, 1998. С.11.
( 3) К таким документам можно от-нести: личные дела спецпоселенцев, (хранятся в Информационном Центре ГУВД Сверд-ловской области); личные дела немцев-работников Тагиллага и треста Тагилстрой, а также других предприятий г. Н. Тагила (Муниципальный архив г. Н. Тагила); карто-тека немцев-трудармейцев Тагиллага (культурно-просветительское общество россий-ских немцев "Цукунфт").
( 4) Определение просопографии см.: Гарскова И.М. Базы и банки данных в исторических исследованиях. Gottingen, 1994. С.96-97.
( 5) См., например: Аханчи П. Ис-торические базы данных как современное направление изучения массовых источников // Круг идей: Развитие исторической информатики. М., 1995. С.28.
( 6) Гарскова И.М. От просопогра-фии к статистике: Методика анализа баз данных по источникам, содержащим динами-ческую информацию // Источник. Метод. Компьютер. Сборник научных трудов. Барна-ул: Изд-во АГУ, 1996. С.128.
( 7) См.: Бугай Н.Ф. И. Сталин - Л. Берия: "Их надо депортировать": Документы, факты, комментарии. М., 1992. С.216; Герман А.А., Курочкин А.Н. Немцы СССР. С.167.
( 8) Маламуд Г. Мобилизованные советские немцы на Урале в 1942-1948 гг. // Репрессии против российских немцев. Наказанный народ... С.129; Герман А.А., Курочкин А.Н. Немцы СССР. С.167.
( 9) Система исправительно-трудовых лагерей в СССР, 1923-1960: Справочник / Об-во "Мемориал", ГАРФ. Сост. М.Б. Смирнов. Под ред. Н.Г. Охотина, А.Б. Рогинского. М.: Звенья, 1988. С.409. Со ссылкой на УИТЛК УМВД по Свердловской области.
( 10) Кириллов В.М. Советские немцы в Тагиллаге // Репрессии против российских немцев. Наказанный народ. С.148.
( 11) Данная цифра косвенно под-тверждается и тем, что последний номер личного дела не превышает число 7210. При этом следует учитывать, что некоторое количество таких личных дел было заведено и на другие категории (интернированных и трудармейцев других национальностей), а также на одного человека могло быть заведено два личных дела.
( 12) Распределение внутри этой возрастной группы примерно равное: По материалам переписи 1939 г. население АССР немцев Поволжья составляло 20-29 лет - 44,4%, 30-39 лет - 36,0%, 40-49 лет - 19,6%, а по данным БД соответственно 39,0%, 38,6%, 22,2%.
( 13) Подсчитано автором по: Все-союзная перепись населения 1939 года: Основные итоги. Россия. С.-Пб., 1999. Таб-лица 25.
( 14) В переписи 1939 г. в число лиц со средним образованием включались лица с неполным средним (7 классов) и с неполным высшим образованием. (См.: Всесоюзная перепись... С.205).
( 15) См.: Всесоюзная перепись населения 1939 года.... С.17.
( 16) Гарскова И.М. Базы и банки данных.... С.102.
( 17) См.: Всесоюзная перепись населения 1939 года.... Таблицы 30-31. С.206-207. На рис. 4.4 выделены следующие группы профессий: I-квалифицированные сельскохозяйственные профессии; II - про-чие сельскохозяйственные профессии; III - занятия металлистов; IV - занятия де-ревоотделочников; V - занятия текстильщиков, швейников, кожевников, обувщиков; VI - занятия пищевиков; VII - строительные специальности; VIII - чернорабочие; IX - прочие занятия рабочих; X - инженерно-технический персонал; XI - медицин-ские работники; XII - культурно-политико-просветительский персонал и работники искусства; XIII - планово-контрольный и учетный персонал, работники торговли и складского хозяйства; XIV - прочие занятия служащих; XV - учащиеся; XVI - не оп-ределены по группам; XVII - нет данных.
( 18) См.: Таллер М. Образ про-шлого: Хранение и доступ к оцифрованным источникам // Круг идей: историческая информатика на пороге XXI века. Труды VI конференции Ассоциации "История и ком-пьютер". Москва-Чебоксары, 1999. С.227.
( 19) Административно-территориальное деление СССР. М., 1941; Список населенных пунктов Средне-Волжского края. Самара, 1931; Stumpp Karl. Die Auswanderung aus Deutschland nach Russland in den Jahren 1763 bis 1862. 1993; и др.
( 20) Подробную характеристику источника см.: Булыгин Ю.С. Образование и развитие населенных пунктов Алтайского края (к оценке репрезентативности источниковой базы) // История. Карта. Компью-тер. Сборник научных статей. Барнаул: Изд-во Алт. ун-та, 1998. С.20-21.
( 21) См.: Варфоломеев А.Г., Си-доров Ю.В. Об эффективности алгоритмов связывания записей // Новые информацион-ные ресурсы и технологии в исторических исследованиях и образовании. Сборник те-зисов докладов и сообщений Всероссийской конференции. М., 2000. С.62-63.
( 22) Подробнее о Soundex-коде см.: Белова Е.Б., Бородкин Л.И., Гарскова И.М. и др. Историческая информатика. М.: Мосгорархив, 1996. Приложение 1. С.356-358; Тяжельникова В., Леверманн В. Источнико-ориентированная обработка данных KLEO. Руководство для пользователя. М., 1995. С.255.
( 23) См., например: Владимиров В.Н., Колдаков Д.В. Образование населенных пунктов Алтайского края: История во времени и пространстве // История. Карта. Компьютер. С.28, 41-42.


Содержание
Издания Ассоциации "История и компьютер"