Моделирование информационных потоков корпоративной распределенной геоинформационной системы

В. С. Шерстнев (Томск)
 

Современные информационные системы, используемые на крупных предприятиях (корпорациях, холдингах), имеют тенденцию к интеграции в единую информационную среду. Кроме этого, интегрированные информационные среды предприятий распространяются на все большие территории, что придает информационной системе распределенный характер. К числу предприятий, подверженных этому процессу, можно отнести предприятия нефтегазодобычи и транспорта.

Обязательным этапом при переходе от корпоративной информационной системы к распределенной является исследование работоспособности системы при ее новом качестве.

Для наглядного описания возможной ситуации рассмотрим холдинг газодобывающих предприятий, разделенный на три уровня: верхний уровень – уровень холдинга, средний уровень – уровень дочернего предприятия холдинга, нижний уровень – уровень исполнительных служб дочерних предприятий холдинга. На каждом уровне функционирует единообразная информационная система. Ядром информационной системы можно считать сервер СУБД. Пользователи локальных ИС насыщают сервер СУБД разнообразной производственной информацией: управляющей, технологической, паспортной, картографической, плановой. Наличие в системе картографической информации заставляет перейти от понятия информационной системы к понятию геоинформационной системы.

Для построения вертикальной управляющей иерархии требуется обеспечить обмен данными между геоинформационными системами уровней. Особенности обмена данными между системами:

·        плановая, паспортная и картографическая информация реплицируется в нисходящем и восходящем направлениях;

·        управляющая информация направлена исключительно вниз;

·        технологическая информация поступает в восходящем направлении.

При возникновении потребности в передаче данных между однородными СУБД уровней логичным решением следует считать системные средства репликации СУБД. При этом данные нижнего уровня реплицируются на верхний уровень посредством среднего, а данные верхнего уровня поступают на нижний, так же проходя через средний уровень.

При этом появляется сетевой трафик некоторой мощности между уровнями предприятия. Исследование поведения подобной системы проведем с помощью теории систем массового обслуживания и имитационного моделирования.

Для использования теории систем массового обслуживания при решении данной задачи следует описать сложившуюся ситуацию в терминах СМО: аппаратах обслуживания транзактов и очередей транзактов.

Сервера локальных геоинформационных систем и каналы связи между ними представим как аппараты обслуживания транзактов. Каждая геоинформационная система обладает очередью транзактов, которые олицетворяют данные, порождаемые пользователями локальных геоинформационных систем. Стык между аппаратами обслуживания (геоинформационной системой и каналом передачи данных) разделен наборами очередей обеспечивающих буферизацию входных и выходных данных.

Данные, циркулирующие в информационных системах, следует разделять по приоритетности: управляющие и технологические данные обладают наивысшим приоритетом, а прочие данные (паспортные, картографические, плановые) – низшим приоритетом. Таким образом, стык между геоинформационной системой и каналом связи описывается четырьмя очередями: исходящая приоритетная, исходящая обычная, входящая приоритетная, входящая обычная. Данные, поступающие от пользователей локальной геоинформационной системы, образуют очередь генерируемых данных. Обобщенная схема взаимодействия элементов системы представлена на рис. 1.

 

  Рис. 1. Обобщенная схема взаимодействия уровней корпоративной распределенной геоинформационной системы

Провести исследование вышеописанной системы можно с помощью системы общецелевого моделирования GPSS (General Purpose Systems Simulator). Для создания имитационной модели на GPSS были задействованы программные оболочки MicroGPSS, GPSSWorld.

Попытка создания имитационной модели на GPSS с помощью наиболее доступной и распространенной оболочки MicroGPSS (разработка Стокгольмской школы высшей экономики) закончилась неудачей, по причине объемного кода созданной GPSS-модели (оболочка MicroGPSS имеет ограничение на количество используемых операторов). Вследствии этого была использована оболочка GPSS World (разработка Minuteman Software). В работе использовалась свободно распространяемая версия GPSS World Student Version 4.3.5. Данная версия содержит ограничения на количество используемых операторов (не более 150), что потребовало переработки изначального кода GPSS-модели в ущерб ее читаемости и наглядности. В целом полученная модель содержала аппараты обработки транзактов (сервера информационных систем и каналы связи между ними), очереди на обработку всех поступающих от пользователей данных (управляющих, технологических, паспортных, картографических, плановых). В качестве механизма обслуживания транзактов (одного уровня приоритетности) в аппарате обслуживания был использован принцип FIFO (first infirst out). На начальном уровне исследования в качестве закона распределения поступающих от пользователя данных (всех типов) за основу был принят Пуассоновский поток. В связи с тем, что частота появления данных некоторых типов много выше чем прочих, законы распределения транзактов (пользовательских данных) так же различаются некоторыми коэффициентами. Характерным примером, иллюстрирующем ситуацию, может служить тот факт, что частота появления в системе технологических данных ежеминутно поступающих с датчиков много выше появления паспортных данных характеризующих введенный в эксплуатацию вентиль или клапан. В качестве интервала моделирования принят календарный месяц, разбитый на 2 592 000 отрезков – секунд.

Полученная модель была исследована средствами оболочки GPSS World. При подстановке определенных значений коэффициентов интенсивности генерации пользовательских данных были обнаружены случаи роста очередей в аппаратах обслуживания (серверах геоинформационных систем, каналах связи). Подбор максимально допустимых значений коэффициентов производился вручную.

Некоторым неудобством созданной GPSS-модели является то, что все циркулирующие транзакты, олицетворяющие пользовательские данные, обладают одинаковым размером. Но реально, в предметной области имеют место порции управляющих данных с размерами в 1 килобайт, и картографические данные размером в 10 мегабайт.

Для более точного подбора значений коэффициентов интенсивностей было разработано программное обеспечение, позволяющее удобно и быстро модифицировать актуальные параметры модели: частоту генерации транзактов (данных), размеры генерируемых транзактов. В основу моделирующего алгоритма разработанного программного обеспечения был положен «принцип особых состояний», который вычисляет состояние системы только в некоторые «особые» моменты времени (моменты поступления входных данных, моменты начала и окончания обработки транзактов и т. д.).

Программное обеспечение написано на языке Object Pascal в среде Delphi 6.0. В процессе разработки программного обеспечения были формализованы и реализованы согласно объектно-ориентированному подходу все участвующие в моделировании объекты. Для оперирования элементами моделируемой системы разработаны классы: «Аппарат обслуживания», «Канал связи», «Очередь», «Транзакт», «Событие» и др.

Интерфейс оригинального имитационного программного обеспечения позволяет корректировать большинство параметров модели непосредственно в процессе моделирования. Для дополнительной наглядности прохождения процесса моделирования в пользовательский интерфейс вынесена информация о размерах всех очередей и доступна для изменения скорость протекания эксперимента. Для удобства проведения множества экспериментов реализована возможность сохранения и последующей загрузки параметров модели. На рис. 2 отражен пользовательский интерфейс программы.

Информация о состоянии аппаратов обслуживания, каналов и очередей во время процесса моделирования сохраняется в файл формата Microsoft Excel, что позволяет в дальнейшем обрабатывать полученные результаты.

 

Рис. 2 . Интерфейс имитационного программного обеспечения

 

Для сравнения результатов полученных с помощью оригинального имитационного программного обеспечения и среды GPSS World, были унифицированы следующие параметры:

·      законы распределения транзактов, поступающих в аппарат обслуживания, упрощены до регулярных;

·      задержки в аппаратах обслуживания использованы, характеризующие скорости обработки данных на серверах геоинформационных систем и скорости передачи данных в каналах связи, приняты одинаковыми;

·      размеры транзактов всех типов, перемещаемых в оригинальном имитационном программном обеспечении, приведены к единому размеру.

При вышеописанных исходных условиях, результаты, полученные в работе оригинального имитационного программного обеспечения, сходятся с результатами, полученными при исследовании модели в GPSS World.

Разработанное оригинальное программное обеспечение расширенно блоком автоматического подбора значений оптимальных коэффициентов законов распределения пользовательских данных. В качестве критериев оценки оптимальных значений коэффициентов законов распределения данных взяты следующие параметры:

·      степень утилизации аппаратов обслуживания;

·      степень утилизации каналов связи;

·      пиковый размер очередей.

Алгоритм оптимизации коэффициентов основан на переборе всех возможных вариантов. Результаты исследования, проведенные на оригинальном программном обеспечении, позволили сделать следующие выводы:

Несмотря на то, что основное время работы системы занимает обработка технологических данных, основную задержку по скорости передачи информации составляет картографическая информация, в силу своих больших объемов. Этот факт принуждает принять решение о раздельной по времени репликации картографической информации и информации прочих видов.

Основная нагрузка по обработке данных ложится на средний уровень, так как он обеспечивает одновременную репликацию нисходящих данных сверху вниз и восходящую информацию с нижнего уровня на верхний. Эксперименты показали, что при увеличении скорости обработки информации на среднем уровне размеры очередей транзактов среднего уровня приближаются к очередям верхнего и нижнего уровней.

В перспективе, возможно применить разработанный блок подбора коэффициентов для поиска оптимальных скоростей обработки данных в аппарате обслуживания, приняв константами уже найденные коэффициенты.

Литература

1.      Бусленко Н.П. Моделирование сложных систем//М.: Наука, 1978. – 400 с.

2.      Марков А.А. Моделирование информационно вычислительных процессов: Учебное пособие для вузов//М.: Изд–во МГТУ им. М.Э. Баумана, 1999. – 360 с.

3.      Руденко Ю.П. Справочник по общим моделям анализа и синтеза надежности систем энергетики//М.: Энергоатомиздат, 1994. – 480 с.

4.      Советов Б. Я., Яковлев С. А. Моделирование систем: Учебник для вузов//М.: Высшая школа, 1985 (1999). – 224 с.