Исторические информационные системы: теория и практика

С. И. Корниенко, 2021

Исторические, или историко-ориентированные, информационные системы – значимый элемент информационной среды гуманитарных наук. Его выделение связано с развитием исторической информатики и историко-ориентированного подхода, формированием информационной среды, практикой создания исторических ресурсов. Книга содержит результаты исследования теоретических и прикладных проблем создания и внедрения историко-ориентированных информационных систем. Это первое комплексное исследование по данной тематике. Одни проблемы в книге рассматриваются впервые, другие – хотя и находили ранее отражение в литературе, но не изучались специально. Издание адресовано историкам, специалистам в области цифровой истории и цифровых гуманитарных наук, а также разработчикам цифровых ресурсов, содержащих исторический контент или ориентированных на использование в исторических исследованиях и образовании. В формате PDF A4 сохранен издательский макет.

Оглавление

  • Введение
  • Глава 1. Исторические информационные системы: понятие, классификация и оценка

* * *

Приведённый ознакомительный фрагмент книги Исторические информационные системы: теория и практика предоставлен нашим книжным партнёром — компанией ЛитРес.

Купить и скачать полную версию книги в форматах FB2, ePub, MOBI, TXT, HTML, RTF и других

Глава 1. Исторические информационные системы: понятие, классификация и оценка

В этой главе рассматриваются состояние и тенденции развития исторических информационных систем на уровне понятийного аппарата, содержания, используемых исторических источников и других параметров. Даются классификация и характеристика некоторых типов систем. Предложена методика оценки историко-ориентированных информационных систем.

1.1. Исторические информационные системы как информационные ресурсы

Информатизация привела к коренным изменениям в информационных среде и структуре исторической науки. Наиболее отчетливо и полно это выразилось в возникновении междисциплинарных направлений на стыке гуманитарных наук, информатики и математики — гуманитарного компьютинга (Humanities Computing), клиометрии, квантитативной истории, исторической информатики (Historical Information Science), цифровых гуманитарных наук (Digital Humanities), цифровой истории и др.

Гуманитарии используют компьютеры для решения профессиональных задач практически с начала появления ЭВМ — с 1950-х годов. Наиболее ярким примером в области компьютерной лингвистики и использования информационных технологий (ИТ) для обработки исторических текстов является проект Index Thomisticus, разработанный священником и ученым Роберто Бусой[1]. В это же время появляются исторические исследования с использованием ЭВМ, в основном для автоматизации обработки статистических данных [Thomas, 2004]. Эта связь между количественными историческими исследованиями и источнико-ориентированной обработкой данных (которая впоследствии стала основой источнико-ориентированного подхода к созданию баз данных) проанализирована в статье М. Таллера [Thaller, 1995]. По мнению автора, несмотря на то, что они часто рассматриваются как противоречия, фактически исключающие друг друга, на самом деле корни источнико-ориентированного подхода лежат в традиции количественных исследований.

До 1980-х годов число гуманитарных исследований с применением компьютеров было невелико; по мнению ряда авторов, они носили случайный характер [Alkhoven, Doorn, 2007; Feeney, Ross, 1993]. С 1980-х годов, с появлением микропроцессорной техники, компьютеры проникают уже во все гуманитарные науки, количество проектов стремительно растет. Но рост и значение ИТ неравномерно распределяются среди разных направлений гуманитарных наук, в некоторых областях роль компьютеров становится более важной, чем в других [Alkhoven, Doorn, 2007]. Неравномерность наблюдается и в отношении типов изучаемых документов — текстовых, статистических, визуальных, звуковых, устных источников и материальных объектов.

Развитие исторической информатики и других направлений, в настоящее время объединенных Digital Humanities, связано не только с научными исследованиями, но и с созданием электронных ресурсов. Необходимость их разработки определяется всем процессом цифровой трансформации общества, переходом к цифровой куль туре. С ростом числа компьютеров, а затем с появлением и распространением Интернета меняются способы создания, поиска, обработки и публикации источников [Alkhoven, Doorn, 2007]; увеличиваются количество и разнообразие цифровых информационных ресурсов, их удельный вес в информационной среде общества.

Заметной частью новой инфраструктуры гуманитарных наук в целом и исторической науки в частности являются предметно-ориентированные и адаптированные к этим областям информационные ресурсы и инструментарий. Исторические информационные ресурсы разнообразны по проблематике и назначению. Они могут быть продуктом академической и публичной истории, разрабатываться профессиональными историками, историками-любителями, студентами и даже школьниками. Это как продукты для научного изучения, продукты-результаты такого изучения, так и продукты для исторического образования и просветительских целей [Корниенко, Власова, Гагарина, 2012].

Среди исторических информационных ресурсов существенное место занимают исторические (историко-ориентированные) информационные системы. Этот вид ресурсов как форма и средство сохранения, организации, обработки и визуализации исторической информации позволяет эффективно решать проблемы учета своеобразия, содержательных и формальных особенностей исторических данных, знаний и науки в целом. Будучи сегодня одним из основных компонентов информационных ресурсов исторической науки и существенной частью информационных ресурсов социально-гуманитарных наук, исторические информационные системы, а также процессы их создания и использования отражают все характерные черты их природы и применения. В этом смысле приобретает определенную важность понимание тех свойств и характерных особенностей исторических информационных систем, которые вытекают из их принадлежности к информационным ресурсам вообще и историческим ресурсам в частности. Это относится прежде всего к определению понятия «исторический информационный ресурс». Для определения, классификации и анализа указанного вида ресурсов недостаточно интуитивного понимания исторической специфики и понимания информационных ресурсов вообще [Корниенко, Власова, Гагарина, 2012]. Как и в отношении ресурсов в целом, применительно к историческим информационным системам такой уровень понимания не обеспечивает нужной четкости определения характера, содержания, установки границ и критериев для отнесения ресурсов к историческим. Более того, при определенном подходе можно расширить границы содержания рассматриваемого понятия на весь круг ресурсов вообще. Очевидно, что с течением времени любые результаты, остатки и свидетельства деятельности человека станут историческими свидетельствами, т. е. историческими источниками. Такой подход к указанному понятию правомерен, поскольку он наиболее полно раскрывает то общее, что характеризует исторические информационные ресурсы как информационные ресурсы вообще. Однако в этом одновременно состоит и недостаток данного подхода. При нем и на формальном, и на содержательном уровнях исчезает специфика исторических информационных ресурсов. Поэтому существует и более строгий подход, основанный на учете природы и предназначения таких ресурсов. В этом случае к историческим информационным ресурсам относят только те, которые созданы специалистами в области исторических исследований или обучения. В то же время такая четкость и определенность оставляют за рамками рассмотрения значимую для исторической науки и образования часть ресурсов, например цифровые музеи, коллекции, библиотеки и тематические сайты междисциплинарного характера, а также любительские ресурсы.

Преодолеть как излишне расширительное толкование, так и чрезмерную строгость в определении понятия «исторический информационный ресурс» позволяет подход, при котором основным критерием служит отношение к предметной области — истории. Иными словами, целесообразно относить к историческим те ресурсы, в которых тем или иным образом присутствует историческая тематика. Такой критерий дает возможность определения исторических информационных ресурсов, минуя имеющиеся противоречия в подходах к этому понятию в научной литературе [Антопольский, 2004, с. 37–45] и законодательстве, а также дискуссии о предмете изучения истории как науки.

Представляется, что указанный подход и вытекающее из него определение достаточно продуктивны для оценки качества, исследовательской и образовательной эффективности использования, дальнейшего развития методик и инструментов создания и применения исторических ресурсов.

Как еще в начале 2000-х годов отмечал А. Б. Антопольский, разработка стандартов описания информационных ресурсов, а следовательно, и качество их документирования во многом связаны с содержанием понятия «информационные ресурсы» и их классификация ми [Антопольский, 2004, с. 37–45]. Разработка таких классификаций и стандартов описания связана с классификацией информационных ресурсов соответственно структуре и содержанию предметной области, для которой они предназначены. В описании исторических информационных ресурсов могут использоваться: атрибуты, общие для информационных ресурсов; исторические атрибуты, в том числе применяемые для описания исторических источников и литературы; назначение ресурсов; типы данных ресурсов; тематические атрибуты [Корниенко, Власова, Гагарина, 2012].

Существенное значение с точки зрения возможностей использования ресурсов имеет классификация по типу данных, которым представлена информация, и по соответствующим информационным технологиям. В этом смысле информационные ресурсы подразделяются на текстовые, гипертекстовые, числовые, графические (в том числе 3D, 4D), аудио-, видео-, мультимедиа-, интернет-ресурсы и др. Такая классификация может использоваться, в частности, для электронных версий источников и объектов культурного наследия — в зависимости от типа источника его электронная версия может быть представлена в виде текстовой, графической (в том числе 3D-графической), аудио — или видеоинформации. Те или иные ресурсы, как правило, являются комбинацией применения различных видов технологий [Корниенко, Власова, Гагарина, 2012].

Еще один аспект анализа исторических информационных систем как информационных ресурсов связан с их значительным распространением в Интернете. Исторические информационные системы как интернет-ресурсы представлены сегодня историко-ориентированными личными и коллективными, многопрофильными и проблемно-тематическими сайтами, порталами, сервисами, форумами, хранилищами данных, веб — и цифровыми историческими архивами, поисковыми системами. Наличие исторического характера и содержания в блогах, электронной переписке, тематических группах и на страницах в социальных сетях превращает содержащие их информационные системы в уникальные современные исторические интернет-ресурсы, обогащает их многообразие и возможности, повышает значимость.

Классификация исторических интернет-ресурсов может проводиться по разным критериям: по цели, содержанию, институциональному принципу, а также по совокупности критериев. Интерес представляют такие группы исторических интернет-ресурсов, как ресурсы, созданные для организации, хранения, обработки и представления массивов исторических источников и публикаций (национальные и международные электронные архивы; электронные библиотеки, каталоги, коллекции; виртуальные музеи; электронные исторические журналы и сайты традиционных периодических изданий); проблемно-тематические исторические интернет-сайты и порталы; сайты исторических научных и образовательных учреждений, а также учреждений хранения и национальной памяти (сайты исторических и гуманитарных факультетов университетов и исследовательских учреждений; сайты музеев, архивов, библиотек) [Корниенко, Власова, Гагарина, 2012].

Изучение исторических информационных систем на теоретическом и прикладном уровнях показывает, что к настоящему времени накоплен определенный опыт их классификации и описания, однако комплексных и общепринятых в среде историков систем классификации и стандартов описания на сегодняшний день не существует. В качестве основной проблемы их создания следует назвать значительное функциональное и содержательное разнообразие, а также быстрое технологическое усложнение. Преодолеть эти препятствия в отношении исторических информационных систем можно на основе анализа основных понятий, эволюции теоретических оснований, практики создания историко-ориентированных систем, разработки критериев для их классификации, выделения основных видов, типов и характеристик. Решению этих задач в значительной степени и посвящены следующие разделы.

1.2. Исторические информационные системы: понятие и эволюция в свете развития исторической информатики

В информатике в широком смысле под информационной системой понимают программный комплекс, к функциям которого относятся обеспечение хранения информации в памяти компьютера, выполнение специфических преобразований информации и предоставление интерфейса [Кузнецов, 2005]. Понятие «информационные системы» охватывает достаточно разнообразные ресурсы.

Первые специализированные публикации по проблематике использования информационных систем в исторической науке появляются в конце 1980-х — начале 1990-х годов. Среди таковых работа И. Кропача, в которой предложено толкование термина «историческая информационная система» [Kropac, 1988]. Как было указано во введении, значительную роль в формировании рассматриваемого класса систем сыграли историческая информатика, историко-ориентированный подход, специфика информационной среды истории и гуманитарных наук в целом, а также практика создания исторических электронных ресурсов, в частности баз данных. Эти аспекты могут быть отправными точками при определении и обосновании указанного понятия, выделении его видовых признаков, разработке классификации, требований, стандартов описания и т. д.

На основе изучения литературы, анализа и обобщения опыта разработки и применения рассматриваемых систем нами было предложено следующее определение: историко-ориентированные информационные системы — это особый класс информационных систем, предназначенных для хранения, организации исторической информации, обеспечения доступа к ней и ее аналитической обработки в соответствии с потребностями исторических исследований, образования и популяризации исторических знаний[2]. Данное определение соответствует имеющимся в литературе общим определениям понятия «информационная система» и отражает сущность историко-ориентированного подхода. Оно позволяет при всем многообразии историко-ориентированных информационных систем выделять их в особый класс на основе достаточно четких критериев, учитывающих специфику информации, методов, технологий ее обработки и визуализации, назначения и функций, связанных с реализацией подходов и методов исторических исследований, решением научных и (или) образовательных, просветительских задач в области истории. На основе данного определения достаточно удобно выстраивается иерархия понятий, связанных с историко-ориентированными информационными системами. Оно корректно соотносится с понятиями верхнего уровня — «информационные ресурсы», «информационные системы», «базы данных», «исторические ресурсы», а также с понятиями нижнего уровня — «исторические базы данных», «просопографические информационные системы», «историко-ориентированные геоинформационные системы (ГИС)» и др. В предложенное определение вполне укладываются и различные потенциальные параметры функционального назначения систем как информационных ресурсов: научно-исследовательские, образовательные, просветительные, политические, формирование и сохранение исторической памяти и др. На исторические информационные системы важно посмотреть и с точки зрения развития исторической информатики.

Историческая информатика (Historical Information Science) — междисциплинарное направление, изучающее теоретические и прикладные вопросы использования информационных технологий в исторической науке и образовании. Это направление приобретает свои очертания в середине 1980-х годов с распространением персональных компьютеров. Л. МакКрэнк, анализируя развитие данной области в период с 1984 по 2000 г., пишет, что историческая информатика вырастает из количественных методов в истории и социальных науках [McCrank, 2002]. Сам термин приходит на смену использовавшемуся ранее понятию «история и вычисления» (History and Computing), введенному по названию одноименного журнала. В отчете «Прошлое, настоящее и будущее исторической информатики» отмечается, что смена термина была удачной, так как история и вычисления — это «неопределенно и запутанно»; при этом историческая информатика не является ни историей, ни вычислением. «Это самостоятельная наука, имеющая собственные методологические рамки», — отмечают О. Бонстра, Л. Брере, П. Доорн [Boonstra, Breure, Doorn, 2006]. Предметом исторической информатики является историческая информация, а также способы ее создания, проектирования, редактирования, анализа и представления с помощью информационных технологий [McCrank, 2002].

Российскими специалистами в области исторической информатики Л. И. Бородкиным, И. М. Гарсковой, В. Н. Владимировым и др. были поставлены существенные методологические и прикладные проблемы, связанные с критическим анализом пройденного исторической информатикой пути и определением направлений ее развития [Бородкин, 2005; Бородкин, Гарскова, 2011; Владимиров, 2006; Гарскова, 2018]; среди них также создание и использование историкоориентированных систем.

Несмотря на стремительное развитие, теоретические обоснования, очевидную практическую значимость и неоднократно описанные в научной литературе перспективы, в настоящее время термин «Historical Information Science» практически не используется в англоязычной литературе. Во многом область исследований и разработок, ранее относившихся к исторической информатике, сейчас рассматривается в русле цифровой истории (Digital History), а также цифровой гуманитаристики (Digital Humanities) как зонтичного термина (umbrella term), объединяющего использование информационных технологий во всех гуманитарных науках. В русскоязычной литературе термин «историческая информатика» используется и сейчас, что связано с активной деятельностью Ассоциации «История и компьютер» и кафедры исторической информатики МГУ им. М. В. Ломоносова. При этом международная ассоциация History & Computing прекратила работу, проведя последнюю конференцию в Амстердаме в 2005 г., а после 2010 г. перестал издаваться и журнал History and Computing. Отмеченные изменения в эволюции направления, определяемого за рубежом понятием «Historical Information Science», а в России — «историческая информатика», привели к неоднозначному пониманию в нашей стране соотношения этого и других терминов, обозначающих в настоящее время процессы информатизации в исторических науке и образовании. Так, И. М. Гарскова в указанной монографии, констатируя факт «сходства в траекториях развития “исторического компьютинга” на Западе и исторической информатики в России до “точки бифуркации” в середине 2000-х годов», говорит об «их кардинальном различии в последнее десятилетие, отмеченном трансформацией “исторического компьютинга” в “цифровую историю” после нее» [Гарскова, 2018].

Однако такой взгляд на соотношение современных терминов, отражающих определенные направления в областях исторического и гуманитарного компьютингов, не является единственным. Не все ученые разделяют мнение о столь резком противопоставлении понятий и соответствующих направлений, разрыве преемственности и утрате сходства. Еще в 1988 г. М. Таллер заметил, что предмет и методы историков настолько разнообразны, что историки часто оказываются ближе связанными с исследователями из других сфер, чем с другими направлениями исторической науки [Thaller, 1988].

Нельзя не признать, что историческая информатика не нашла достаточного и заслуженного признания в среде традиционных историков. На это обращали внимание исследователи уже в 1990-х и 2000-х годах; очевидно, это можно констатировать и на текущем этапе. Так, в 1994 г. В. А. Спек отмечал: «…факт остается фактом: профессия по-прежнему разделена между небольшим меньшинством историков, которые используют компьютеры в качестве инструментов для анализа исторических данных, и подавляющим большинством, которые, хотя и могут использовать компьютер для набора текста, не думают о том, что он может стать методологическим активом» [Speck, 1994[3]]. А так Л. МакКрэнк пишет об ученых-историках в 2002 г.: «Как люди такого характера, интеллекта, образования и позиции влияния могут быть настолько устойчивы к информационным технологиям? Могут ли они не видеть возможности, которые предлагают технические достижения нашего времени?» [McCrank, 2002]. Достаточно подробный обзор противостояния традиционных историков и тех, кто использовал количественные методы и технологии, приведен в статье У. Дж. Томаса «Вычисления и историческое воображение» [Tomas, 2004].

Не вдаваясь в причины указанных изменений и проблем, а также в соотношение терминов «историческая информатика», «цифровая история», «цифровая гуманитаристика» (как было отмечено, существуют разные подходы и достаточное количество литературы по данному вопросу [Бородкин, 2005; Бородкин, 2012; Владимиров, 2006; Гарскова, 2014]), отметим, что формирование и методология исторической информатики как самостоятельного междисциплинарного направления напрямую проецируются на понятийный аппарат и идеологию создания и использования историко-ориентированных информационных систем. Именно в связи с этим становление и развитие исторической информатики и ее подходов представляют ценность для понимания феномена историко-ориентированных информационных систем.

Выделим несколько важных, на наш взгляд, аспектов.

Во-первых, точно так же как неологизм «историческая информатика» не является просто сочетанием истории и информатики (здесь скорее в смысле Information Science, а не Computer Science), давая больше, чем сумму этих частей [McCrank, 2002], историческая (историко-ориентированная) информационная система — это больше, чем просто сумма истории (исторических данных, знаний) и информационных систем.

Во-вторых, историческое в исторической информатике понимается в самом широком смысле, оно «не ограничивается историей как дисциплиной, также история является краеугольным камнем других гуманитарных наук» [Boonstra, Breure, Doorn, 2006].

В-третьих, исторические информационные системы, как и историческая информатика, используют практически все виды исторических источников — числовые, текстовые, материальные, устные, аудиовизуальные и др. В некотором смысле историческая информатика даже способствует более активному внедрению в научный оборот нетекстовых источников. С точки зрения хронологии, географии и проблематики исторического исследования историческая информатика также не имеет ограничений. Наконец, «каждая технология и методология кажутся восприимчивыми к принятию историками, адаптированными к историческим исследованиям… Никаких ограничений, кроме самоналоженных, не видно» [McCrank, 2002]. Эта «всеядность» исторической информатики определяет разнообразие историко-ориентированных информационных систем и множество оснований для их классификации (к чему мы вернемся позже в этой главе).

В-четвертых, историческая информатика не просто исходит из понимания истории как науки и как направления, имеющего научную базу и доказательные методы документации и интерпретации (не принимая постмодернистские трактовки истории и «рассказы об истории»), но и усиливает научность истории. Л. МакКрэнк отмечает в связи с этим, что информатику можно рассматривать как «судебную экспертизу истории»; что задача исторической информатики — не просто информирование, а «создание основы для приемлемости, надежности и достоверности информации и ее интерпретации в контексте, как ближайшем и непосредственном, так и в более отдаленном» [McCrank, 2002]. В этом смысле особенно заметны роль и наследие квантитативной истории и математических методов в истории в формировании исторической информатики. Несмотря на то, что методологически, содержательно и технологически историческая информатика выходит за пределы квантитативной истории, тем не менее в требованиях системности, верифицируемости, объективности и доказательности — не уступает ей.

Эти повышенные (по сравнению со средними по истории в целом) ожидания и требования научности исторической информатики определяют принципы и подходы к проектированию, наполнению и дальнейшему использованию исторических информационных систем. Хотя при заполнении базы данных, разметке исторического источника, нанесении объектов на географическую карту или реконструкции памятника исследователь также вынужден принимать субъективные решения, есть значимое отличие в их характере по сравнению со многими другими направлениями исторической науки: эти операции с историческими сущностями более четко фиксируются и, как правило, предполагают простые инструменты корректировки при уточнении данных либо даже позволяют заложить в модель информацию о достоверности тех или иных источников. Одновременно акцент исторической информатики на научности истории делает особо значимыми информационные системы для поддержки научных исторических исследований. Д. А. Гутнов и В. А. Перевертень выделили в отдельный класс компьютерные системы, созданные для поддержки информационно-познавательной деятельности историков. Для обозначения этого понятия авторы предложили использовать термин «историко-исследовательские информационные системы» [Гутнов, Перевертень, 1994]. К этому типу систем и их использованию в исследованиях мы вернемся в главе 4.

Таким образом, исторические информационные системы определенно открывают новые перспективы организации и массовой обработки исторического материала, большей формализации исторического знания и применяемых в нем доказательств.

1.3. Историко-ориентированные базы данных

Выделение класса и термина «историко-ориентированные информационные системы» связано с практикой создания исторических баз данных, которые долгое время были и все еще часто остаются технологической основой информационных систем. Развитие понятийного аппарата, подходы к созданию и классификация, а также другие теоретические и прикладные вопросы тесно связаны и во многом схожи для исторических баз данных и информационных систем. Можно отметить и такой признак, как типичное объединение двух видов ресурсов в одну секцию на профильных конференциях по исторической информатике и цифровой гуманитаристике.

Феномен внимания историков и других гуманитариев к технологии баз данных интересен сам по себе. «База данных становится центром творческого процесса в компьютерную эпоху», — пишет Л. Манович в 1999 г. Анализируя базы данных как культурную форму, он приходит к выводу, что база данных и нарратив являются «естественными врагами»: база данных представляет предметную область как неотсортированный список; нарратив же, напротив, создает линейное, а значит, последовательное и, возможно, причинно-следственное повествование, которое кажется неупорядоченными событиями. «Конкурируя на одной и той же территории человеческой культуры, каждый из них претендует на исключительное право сделать смысл из мира» [Manovich, 1999]. В некотором роде базы данных являются новой, текущей и будущей формой знаний, заменяя повествование в изучении истории и литературы [Drucker, Kim, Salehian, Bushong, 2013].

Базы данных относятся к эффективным средствам структурирования и организации информации. В зависимости от модели, которая положена в основу базы данных, она может быть иерархической, сетевой или реляционной. Возможность организации данных в базе на основе разных моделей позволяет наиболее адекватно представлять информацию об отображаемых объектах и эффективно работать с ней. Проектирование и создание информационных систем на основе реляционных баз данных будет подробно рассмотрено в главе 2; задача этого раздела — показать влияние исторических баз данных на формирование теории и понятийного аппарата информационных систем, используемых в области истории.

Наиболее значимо и комплексно исторические базы данных рассмотрены в исследованиях М. Таллера. В его работах, изданных в период с 1980-х по 2000-е годы, зафиксированы возникновение исторических баз данных, их эволюция, состояние и значимость на разных этапах информатизации истории.

Технология баз данных была и продолжает оставаться одной из наиболее востребованных в исторической информатике, цифровой истории и цифровых гуманитарных науках. На ее основе создаются электронные каталоги, цифровые архивы и библиотеки, тематические исторические ресурсы, коллекции машиночитаемых источников, публикаций и др. Созданные на основе технологии баз данных исторические информационные системы позволяют оптимальным образом сохранять, организовывать, визуализировать историческую информацию и обеспечивают необходимый доступ к ней.

Ч. Харви и Д. Пресс в обобщающем труде «Базы данных в исторических исследованиях. Теория, методы и приложения», изданном в 1996 г., говорят о том, что «проектирование и разработка баз данных играют центральную роль в трансформации методов исследований в истории». Авторы отмечают значимость этой технологии для разработки систем хранения первичных и вторичных источников, создания исследовательских ресурсов, связывания записей (record linkage), организации, поиска и сортировки исследовательских материалов, анализа и представления исторической информации в целом [Harvey, Press, 1996].

С началом внедрения систем управления базами данных (СУБД) перед историками встал вопрос об использовании программ общего назначения или разработке собственных решений. Данный вопрос решался индивидуально: «некоторые историки экспериментировали со стандартным программным обеспечением для баз данных: недружелюбными иерархическими СУБД, которые требовали программирования для навигации и поиска данных, или еще не полностью развитыми реляционными базами данных» [Boonstra, Breure, Doorn, 2006, p. 26].

С развитием и распространением реляционных баз данных, в силу своей простоты, адаптивности и универсальности, они быстро стали популярными и у историков [Denley, 1994; Harvey, Press, 1996]. Однако, как было показано в работах М. Таллера и других ученых, реляционная модель имеет серьезные ограничения при структурировании исторических источников. Так, исторические данные плохо вписываются в поля фиксированной длины, которые часто оказываются пустыми из-за отсутствия информации или содержат более одного значения; историки постоянно имеют дело с недесятичными системами счисления, изменяющимися топонимами; одно и то же слово может означать географическую принадлежность или просто быть фамилией [Thaller, 1988].

Решением этих проблем стало создание М. Таллером в начале 1980-х годов специализированной СУБД Клио (др. — греч. Κλειω) [Таллер, 1995], которая отличалась поддержкой нечеткости исторической информации и гибкостью форматов данных. Создание специализированной системы, как пишут О. Бонстра, Л. Брере и П. Доорн, «ознаменовало новый период исторического компьютинга» [Boonstra, Breure, Doorn, 2006, p. 26].

Существенным шагом в осмыслении рассматриваемых проблем являлась дискуссия о подходах к созданию историко-ориентированных баз данных, начатая М. Таллером и П. Доорном [Доорн, 1995; Таллер, 1993]. Ее результатом стало обоснование и утверждение двух основных подходов: проблемно-ориентированного и источнико-ориентированного, которые вполне можно рассматривать в качестве подходов к созданию историко-ориентированных систем в целом (что будет сделано в главе 2). Помимо указанных были предложены методо-ориентированный и пользовательско-ориентированный подходы, однако они не оказали определяющего влияния на развитие направления.

Постановка вопросов об источнико-ориентированном и проблемно-ориентированном подходах к созданию баз данных для исторических исследований означала видение специфики информационных ресурсов для исторической науки не только в том, что они содержат информацию особого рода — историческую, но и в переносе акцентов в понимании специфики исторических ресурсов вообще и историко-ориентированных баз данных в частности в область организации информации исторических источников и методов их обработки.

В этом смысле показательна позиция В. Леверманна, который через обоснование понятия «источнико-ориентированная обработка данных» развивает понятия «источнико-ориентированный подход» и «источнико-ориентированная информационная система» [Леверманн, 1994]. При этом содержание указанного понятия раскрывается словами М. Таллера о том, что источнико-ориентированная обработка данных, в противоположность так называемой методо-ориентированной, — «это стремление смоделировать в компьютере весь объем информации, содержащейся в историческом источнике; это попытка обеспечить возможность использования источника в самых разнообразных целях. Предоставляя историку средства для различных типов анализа, он не требует от него на этапе создания базы данных принятия решения о том, какие методы будут позднее использованы» [Таллер, 1993]. Отмечая достоинства и значение источнико-ориентированной обработки данных, В. Леверманн акцентирует внимание на том, что она ориентирована на максимально точное сохранение источника и предоставление широкого диапазона средств, позволяющих использовать различные аналитические подходы к ним [Леверманн, 1994].

Примечательно, что в предисловии редакции к сборнику научных трудов, в котором была опубликована цитируемая работа В. Леверманна, вводится и такое понятие, как «специализированное источнико-ориентированное программное обеспечение» [Круг идей…, 1994, с. 5]. Здесь же сформулирован вопрос о соотношении источнико-ориентированных технологий и информационных систем для обработки исторических данных. Отвечая на него, авторы указали, что проблема источнико-ориентированных технологий не сводится только к соответствующим системам, а связана с идеологией отношения к информации, в центре которой — сохранение инфраструктуры данных (структурной, семантической), возможность воспроизвести историографическую и культурную среду исследовательского процесса. Приведенные положения обогащают понимание историко-ориентированного подхода и историко-ориентированных информационных систем аспектами, связанными с программным обеспечением и технологиями. Кроме того, в них сформулированы и важнейшие принципы обеспечения специфики исторической информации, создания и эффективности историко-ориентированных информационных систем: сохранение инфраструктуры исторических данных, возможность воспроизведения историографической и культурной среды исторического исследования [Круг идей…, 1994, с. 7, 8].

Можно однозначно констатировать, что базы данных на много лет заняли нишу основного средства организации исторической информации и структурирования исторических источников. Историки и в настоящее время активно используют СУБД общего назначения для решения своих задач. Но нельзя не отметить, что в последнее десятилетие ведущим стандартом представления текстовых источников в гуманитарных науках (особенно в лингвистике и литературоведении) стал стандарт TEI (Text Encoding Initiative), позволяющий на основе XML проводить глубокую разметку текстов. Эта технология, с одной стороны, нивелирует недостатки реляционной модели и стандартных СУБД, а с другой — является более простой и доступной по сравнению с Κλειω.

Конец ознакомительного фрагмента.

Оглавление

  • Введение
  • Глава 1. Исторические информационные системы: понятие, классификация и оценка

* * *

Приведённый ознакомительный фрагмент книги Исторические информационные системы: теория и практика предоставлен нашим книжным партнёром — компанией ЛитРес.

Купить и скачать полную версию книги в форматах FB2, ePub, MOBI, TXT, HTML, RTF и других

Примечания

1

Index Thomisticus [Электронный ресурс]. URL: http://www.corpusthomisticum. org/it (дата обращения: 10.07.2020).

2

Это определение было впервые нами предложено в: Кирьянов И. К., Корниенко С. И., Гагарина Д. А., Рябухин И. В. Информационный ресурс по парламентской истории России начала XX в. // Власть. 2010. № 12. С. 83–86. В текущем варианте добавлено «…и популяризации исторических знаний», чего не было в исходной редакции.

3

Цит. по: Anderson I. History and computing // Making History [Электронный ресурс]. URL: http://www.history.ac.uk/makinghistory/resources/articles/ history_and_computing.html (дата обращения: 27.08.2018).

Смотрите также

а б в г д е ё ж з и й к л м н о п р с т у ф х ц ч ш щ э ю я