Scientific journal
Fundamental research
ISSN 1812-7339
"Перечень" ВАК
ИФ РИНЦ = 1,674

DATA MODELS COMPLEX IS THE BASIS OF REFERENCE DATA SYSTEM DEVELOPMENT

Chernikov B.V. 1
1 LLC «Gazprom VNIIGAZ» Plekhanov Russian University of Economics
The development of information technologies and the accompanying creation of information systems complexes predetermine the tendency for their application in organizations and enterprises in the context of the formation of a single information space. Integration makes it possible to expand the capabilities of information systems by attracting additional computing resources to information processing. With the independent creation and implementation of information systems, problems can arise that prevent the integration of systems into a single complex. As a result, organizations get a set of information systems with a heterogeneous data structure. Consideration of the composition of complex of models, the development of which is necessary at the stage of information analysis when forming a single information space of an organization or enterprise is the purpose of this paper. A method of many problems solving is the formation of an information model of circulating information. The creation of the model provides a stable information interaction between the objects of the information systems complex. In addition, the information field is organized due to classification and harmonization of the processed information on the basis of the ontological model. The importance of this model is particularly high in the organization of interaction of information systems performing mutual data exchange because it is the basis for constructing a system of reference data. Integration of information systems and sustainable operation of systems in a complex are provided on the basis of the harmonization of the data of the information model with the data of the ontological model.
information system
information systems integration
single information space
information model
reference data

Объединение информационных систем организации в единое информационное пространство позволяет в полной мере осуществлять обмен данными между системами различного функционального назначения без дополнительных преобразований данных. Непременным условием успешного взаимодействия информационных систем в этом случае является своевременное создание адекватной системы нормативно-справочной информации. Эта система должна содержать комплекс классификаторов и справочников, направленный на поддержание устойчивой и эффективной работы со всеми категориями циркулирующей информации. В интересах построения необходимой системы нормативно-справочной информации требуется глубокий информационный анализ всех компонентов информации, которая должна использоваться взаимодействующими информационными системами. Результатом такого анализа является комплекс моделей данных, разносторонне характеризующий циркулирующую информацию. Такой комплекс моделей позволяет сформировать классификаторы и справочники, которые будут использоваться в последующей работе информационных систем.

Актуальность и цель исследования

В последние десятилетия развитие информационных технологий прибрело поистине революционный характер. Совершенствование информационных систем, создание более эффективных информационных технологий привело к тому, что информатизация процессов и предприятий во многих случаях стала играть едва ли не определяющую роль. Свидетельством этому становится существенное расширение направлений исследований, направленных на повышение эффективности информационных технологий, возможности которых совсем недавно еще трудно было предсказать. При этом исследователи отмечают, что «…четвертая промышленная революция, в отличие от трех предыдущих, характеризуется тесной интеграцией современных информационно-коммуникационных технологий с классическими индустриальными процессами. При этом образуются так называемые кибер-физические системы» [1].

Развитие информационных технологий по отдельным направлениям позволяет создавать специализированные системы, предназначенные для обработки определенного рода информации. Расширение номенклатуры таких информационных систем приводит к тому, что организации и предприятия становятся обладателями достаточно объемного перечня отдельных систем, весьма условно сочетаемых друг с другом. Образуются гетерогенные информационные структуры, или, как жаргонно называют такое состояние специалисты по информационным технологиям, своеобразный «зоопарк» информационных систем. Их согласованная работа «напрямую» практически невозможна, потому что создаются многие системы без учета глубокого анализа циркулирующей информации. Разработчиками часто принимается в разработку только тот объем данных, который необходим именно для конкретной системы. При этом очень часто не обращается внимание на системы, «соседние» с создаваемой, с которыми необходимо обмениваться информацией и вести совместную обработку данных. И уж практически всегда создание систем ведется без учета возможного развития информационного парка организаций и предприятий. Однако очень часто информационные системы, выполняя отдельные функции, пересекаются по своим функциональным задачам, требуя для выполнения своих функций эффективного и надежного информационного обмена.

Устойчивый обмен данными между различными информационными системами без дополнительных преобразований информации обеспечивается при комплексировании систем и организации единого информационного пространства. Вопросы комплексирования информационных систем в последние годы часто рассматриваются специалистами им посвящены, например, работы [2–6]. Создание комплекса информационных систем и образование единого информационного пространства, как отмечается в работе [7], весьма непростая задача, как иногда может показаться. Комплексирование систем сопряжено с необходимостью решения значительного объема задач. Следует заметить, что в тех случаях, когда вопросы интеграции учитываются заблаговременно, сопряжение информационных систем проходит с меньшими проблемами. В противном случае необходимо открывать специальный интеграционный проект.

Нет сомнений в том, что любая организация или предприятие стремится к полноценному и качественному информационному обеспечению своей деятельности. Принципиальное значение для обеспечения надежной работы создаваемых комплексов имеет качество информации. Проблемы и задачи различных аспектов управления качеством при создании и внедрении систем рассматривались, например, в книгах [8, 9], где отмечалась важность проведения анализа циркулирующей информации. Совокупность требований к информации в смысле обеспечения ее качества приводится в работе [10]. Особенное значение для устойчивой работы создаваемых комплексов имеет такой информационный компонент, как метаданные, формирование которых, как правило, представляет собой отдельную, причем очень важную задачу. Фундаментом, на котором строятся комплексы информационных систем, является согласованная система классификации и кодирования, лежащая в основе системы нормативно-справочной информации (НСИ). Совокупность классификаторов и справочников обеспечивает информационные системы, входящие в состав образованного комплекса, единой терминологией, унифицированными формами документов, стандартизованными сведениями об отдельных компонентах данных, используемых информационными системами в процессе их функционирования. Именно благодаря этой совокупности составляющих интегрируемые информационные системы работают гармонично, адекватно воспринимая получаемую информацию без дополнительной обработки и конвертирования. Целостность и непротиворечивость информации, используемой при обработке, достигается формированием системы нормативно-справочной информации на основе комплекса моделей данных, которые должны разрабатываться на стадии проведения информационного анализа с учетом содержания и структуры данных всех информационных систем, объединяемых в единое информационное пространство.

Целью настоящей работы является рассмотрение состава комплекса моделей, разработка которых необходима на этапе информационного анализа при решении задач объединения информационных систем в единый комплекс или при формировании единого информационного пространства организации или предприятия.

Роль НСИ в гармонизации обмена в комплексах информационных систем

Достаточно традиционной является ситуация взаимодействия информационных систем в конфигурации, приведенной на рис. 1.

Возможность корректного обмена данными обеспечивается лишь между непосредственно сопрягаемыми системами посредством образования своеобразной «локальной» (иногда ее называют «кусочной» или «островной») интеграции, в которую вовлечено минимальное количество информационных систем. При этом зачастую даже в такой схеме информационного обмена необходимо дополнительное конвертирование данных ввиду возможного несоответствия структур информации в сопрягаемых системах. При такой схеме нормальный информационный обмен с адекватным восприятием передаваемых данных будет обеспечен только между конкретными системами совокупности. Во многом это объясняется размещением компонентов нормативно-справочных данных в локальных системах НСИ, относящихся к различным информационным системам. При этом классификационные и справочные данные могут быть сформированы таким образом, что их конфигурация не совпадает во всех сопрягаемых системах.

В то же время требуется обеспечить границы полной интеграции комплекса, охватывающие все объекты сопряженных систем. При условии выполнения интеграционных работ будет сформировано единое информационное пространство (ЕИП). В этом случае все информационные системы, объединенные ЕИП, будут функционировать на полном множестве данных созданного информационного поля, и дополнительное конвертирование данных (или любое предварительное преобразование циркулирующей информации) в такой схеме интегрированного комплекса информационных систем уже не потребуется (рис. 2).

chern1.tif

Рис. 1. Схема взаимодействия информационных систем в условиях локальной интеграции

chern2.tif

Рис. 2. Схема взаимодействия информационных систем в условиях единого информационного пространства

Одной из специфических особенностей подобной конфигурации программно-аппаратного комплекса является создание и поддержка единой для всего комплекса системы нормативно-справочной информации. В этих условиях обеспечивается гармонизированная работа всех информационных систем, не требующая дополнительных преобразований данных. Формирование такой структуры позволяет осуществлять аналитическую работу, используя данные от всех систем, входящих в комплекс. Кроме того, для хранения данных достаточно организовать одно хранилище данных. При этом, безусловно, не исключается наличие локальных хранилищ данных, специфичных для отдельных систем. Однако такие хранилища потребуют использования весьма небольших объемов и будут предназначены в основном для размещения данных, локально обрабатываемых отдельными информационными системами. Следует отметить, что отличительной особенностью такой гомогенизированной структуры комплекса информационных систем является наличие единой системы нормативно-справочной информации. Именно поддержка функционирования комплекса информационных систем со стороны единой системы НСИ позволяет унифицировать межсистемный информационный обмен и обеспечить гармонизированную работу сопряженных систем.

Формирование единого информационного пространства на основе комплексирования информационных систем сопряжено с необходимостью выполнения условий, при которых элементы создаваемого комплекса полноценно обмениваются информацией. Эти условия неоднократно упоминались в работах, посвященных механизмам создания единого информационного пространства (например, [4, 7, 11–13]).

Два из таких условий (иначе – принципов или механизмов) особенно важны в рамках проблемы интеграции информационных систем.

1. Использование единой информационной модели предметной области, в интересах которой создается комплекс систем. В данном случае, как отмечено в работе [7], информационная модель предметной области характеризует «…вид деятельности (совокупность видов деятельности), организацию (предприятие) или информационную систему (комплекс систем) как иерархическую совокупность взаимосвязанных компонентов (процессы и информационные объекты), выполняющих свои функции для достижения общей цели в едином информационном пространстве». Как отмечает Е.В. Франгулова в работе [6], в настоящее время наиболее популярна информационно-ориентированная интеграция по причине, прежде всего, высокой степени распространения программного обеспечения, создаваемого на основе реляционных баз данных, а также соответствующих стандартов. Следует отметить, что и само программное обеспечение должно соответствовать необходимому уровню качества. Методы управления качеством программного обеспечения рассматривались в работах [14, 15].

2. Создание системной основы для разработки и построения полноценной системы нормативно-справочной информации. Важность такой категории информации, как метаданные, в своей совокупности непосредственно влияющих на образование системы, подчеркивал Ю.И. Рогозов в работах [16, 17], а также О.В. Шевченко в работе [18]. Так, О.В. Шевченко отмечает, что «…метамодель понимается как модель предметной области, описанная на нескольких уровнях абстракции, где каждый высший уровень полностью, целостно и непротиворечиво задает структуру данных, функциональность, отображение и связи низших уровней» [18]. Учитывая чрезвычайную важность корректного построения системы НСИ в интересах обеспечения последующей эффективной работы комплекса информационных систем, становится понятно, что единая информационная модель предметной области, сформированная на основе унифицированной и типизированной информации, является основой для выделения необходимой совокупности метаданных. Именно на их основе строится классификационная модель, а также выделяются нормализующие и справочные компоненты. Именно эти информационные блоки должны быть положены в основу комплекса классификаторов и справочников, используемых в системе НСИ, обеспечивающей функционирование комплекса интегрируемых систем. В этом плане следует отметить особую значимость выполнения интеграционного проекта с проработкой информационных аспектов. Как правило, недостаточная проработка таких вопросов приводит к отсутствию адекватной и полноценной информационной модели и, следовательно, столь необходимой модели данных. А наличие проблем в этой области приведет к сложностям при формировании единого информационного пространства.

Информационный анализ и модели данных

В интересах создания системы нормативно-справочной информации, гармонизирующей работу комплекса информационных систем, необходимо провести анализ циркулирующей информации с последующей разработкой комплекса моделей данных. При этом циркулирующая информация должна соответствовать определенным требованиям, которые достаточно подробно рассмотрены в работе [10].

К компонентам модели данных Э. Кодд в работе [19] относил следующие составляющие:

  • коллекции типов объектов данных, образующих базовые строительные блоки для любой базы данных;
  • коллекции общих правил целостности, ограничивающих набор экземпляров тех типов объектов;
  • коллекции операций, применимых к таким экземплярам объектов.

Связывая предложенные классиком принципы построения базовых структур данных, модель данных можно определить как нормализованную взаимосвязанную структуру компонентов информации с указанием свойств и состояния ее элементов.

Для построения единой модели данных, предназначенной для поддержки функционирования комплекса информационных систем, сопрягаемых в рамках единого информационного пространства, должен быть проведен глубокий информационный анализ, результатом которого является сформированная информационная модель. При этом информационная модель представляет собой подмножество бизнес-модели, описывающее все существующие (в том числе не формализованные в документальном виде) информационные потоки, правила обработки и алгоритмы маршрутизации всех элементов информационного поля. Информационная модель включает в себя все формы документов, структуру справочников и данных и прочие составляющие с указанием источников сведений и адресатов их использования. В связи с этим можно утверждать, что информационная модель представляет собой концептуальную модель информации предметной области. Состав информационной модели приведен на рис. 3.

Корректное формирование сохраняемых структур данных осуществляется при последовательной разработке моделей.

Инфологическая модель данных представляет собой обобщенное описание предметной области, не привязанное к каким-либо средствам вычислительной техники или системам управления базами данных (СУБД). Инфологическая модель, ориентированная на человека, содержит общую характеристику наборов данных их состав, типы, длину информационных кортежей, виды связей между компонентами наборов и т.д.

chern3.tif

Рис. 3. Состав информационной модели комплекса информационных систем

chern4.tif

Рис. 4. Структура работ по формированию комплекса моделей

Далее разрабатываются компьютеро-ориентированные модели, используемые СУБД. Даталогическая модель данных содержит описание данных на языке конкретной СУБД. Непосредственное описание сохраняемых данных, размещаемых впоследствии в хранилище данных, содержится в физической модели данных.

Постоянное развитие инфраструктуры организаций и сопутствующее этому совершенствование информационного обеспечения свидетельствует о том, что информационная модель должна расширяться и уточняться по мере развития комплекса интегрируемых систем и масштаба охвата видов деятельности.

Общая структура проводимых работ может быть представлена в виде схемы, приведенной на рис. 4.

К особенностям совокупности работ по формированию комплекса моделей следует отнести следующие аспекты:

1. Наличие циклического участка работ (правый верхний угол схемы). Охватываемые циклом работы выполняются до уточнения онтологических и семантических связей информационных компонентов и полного «выравнивания» информационного поля. Это необходимо для корректного построения классификационной модели информации, которая, будучи положена в основу системы нормативно-справочной информации, должна распространяться на все компоненты формируемого комплекса интегрируемых систем.

2. Необходимость использования методов семантического анализа и онтологического инжиниринга в процессе выполнения работ по формированию комплекса моделей. На значимость учета семантических и онтологических факторов при анализе информации указывал Р. Карнап в работах [20, 21]. Особенности применения онтологического моделирования при разработке информационных систем рассматривались в работах [13, 22, 23].

Преимущества корректного формирования системы НСИ на основе комплекса моделей

Разрозненная, или «посистемная», информатизация организаций или предприятий предполагает последовательную разработку и внедрение информационных систем, функционирование каждой из которых поддерживается собственной системой нормативно-справочной информации (рис. 5).

Такая схема развития парка средств вычислительной техники в организациях вынуждает прибегать к проведению доработок системы НСИ во всех ранее внедренных системах НСИ при вводе в строй каждой новой системы. Это необходимо в интересах обеспечения адекватной поддержки информационного обмена между всеми информационными системами, включая вновь внедренные в деятельность организаций. Понятно, что помимо регулярных доработок локальные системы НСИ будут обладать определенным уровнем избыточности. Оба этих аспекта вызывают необходимость использования дополнительных ресурсов, как финансовых, так и программно-технических.

При информатизации организаций на базе единой платформы НСИ поддерживается общая система нормативно-справочной информации, причем развитие комплекса информационных систем сопровождается лишь необходимым расширением и дополнением системы НСИ (рис. 6).

chern5.tif

Рис. 5. Модель развития комплекса систем при «посистемной» информатизации

chern6.tif

Рис. 6. Модель развития комплекса систем при единой платформе НСИ

chern7.tif

Рис. 7. Гармонизация данных на уровне онтологий

При таком развитии комплекса информационных систем в случае последовательной информатизации осуществляется эволюционное дополнение необходимых компонентов системы НСИ, что можно назвать «накоплением» нормативно-справочной информации по мере появления в комплексе новых систем. Сокращение объемов выполняемых работ и привлекаемых ресурсов при этом наблюдается благодаря тому, что интеграция информационных систем осуществляется путем гармонизации данных информационной модели с данными онтологической модели (рис. 7).

Подобная гармонизация данных возможна благодаря тому, что в онтологических моделях информации, относящейся к разным информационным системам, системные аналитики без особого труда могут выявить совпадающие фрагменты данных. Именно этот факт позволяет осуществлять «встраивание» онтологий новых систем в уже существующую унифицированную модель данных развивающегося комплекса информационных систем.

Заключение

1. Объединение информационных систем организации в единое информационное пространство позволяет в полной мере осуществлять обмен данными между системами различного функционального назначения без дополнительных преобразований данных.

2. Непременным условием успешного взаимодействия информационных систем является создание адекватной системы нормативно-справочной информации. Поддержка функционирования комплекса информационных систем со стороны единой системы НСИ позволяет унифицировать межсистемный информационный обмен и обеспечить гармонизированную работу сопряженных систем.

3. В интересах построения необходимой системы нормативно-справочной информации требуется глубокий информационный анализ всех компонентов информации, которая должна использоваться взаимодействующими информационными системами. Результатом проведения информационного анализа является построение информационной модели, объединяющей комплекс моделей данных.

4. Совокупность работ по формированию комплекса моделей должна содержать этап семантического анализа и онтологического инжиниринга, а также циклический участок работ, необходимый для разработки корректной классификационной модели информации.

5. Создание единой платформы нормативно-справочной информации должно осуществляться на основе «встраивания» онтологий новых систем в уже существующую модель данных.