ОПТИМАЛЬНЫЙ СИНТЕЗ АВТОМАТИЧЕСКИХ СИСТЕМ РЕГУЛИРОВАНИЯ МЕТОДОМ ИМИТАЦИОННОГО МОДЕЛИРОВАНИЯ С ИСПОЛЬЗОВАНИЕМ ГЕНЕТИЧЕСКИХ АЛГОРИТМОВ ОПТИМИЗАЦИИ

В. Р. Сабанин, Н. И. Смирнов, А. И. Репин (Москва)

 

Рассматриваются новые тенденции в области анализа качества работы автоматических систем регулирования (АСР) и настройки регуляторов различной структуры. Показаны широкие возможности настройки и анализа АСР методами имитационного моделирования с использованием современных генетических алгоритмов оптимизации.

Приводится краткое описание классического генетического алгоритма оптимизации и предложенной авторами его модификации. С использованием предложенного алгоритма проведен анализ одноконтурной АСР с ПИ- и ПИД-регуляторами и двухконтурной АСР с ПИ- регулятором и дифференциатором, а также АСР с нейрорегуляторами различной структуры.

Расчет настроечных параметров регулирующих устройств, обеспечивающих оптимальное значение критерия качества составляет основное содержание задачи синтеза АСР.

Сложность такой оптимизационной задачи в первую очередь зависит от алгоритмов функционирования регуляторов и от структуры системы [1].

Известные методы оптимального синтеза АСР как правило хорошо формализованы и доступны для практического использования. Однако увеличение числа оптимизируемых настроечных параметров по мере усложнения алгоритма функционирования регулятора и структуры АСР в значительной степени усложняет поставленную задачу, делая результат решения обоснованным лишь при определенных ограничениях и допускаемых приемах декомпозиции.

В этих условиях достаточно надежное решение поставленной задачи практически возможно только численными методами пошаговой оптимизации целевой функции, зависящей от настроечных параметров анализируемой системы.

Возможности современной вычислительной техники существенно расширяют спектр методов оптимизации и имитационного моделирования как линейных, так и нелинейных динамических систем. Традиционные ПИ- и ПИД-алгоритмы регулирования дополнились нейроконтроллерами и регуляторами с нечеткой логикой.

В задачах нейросетевых технологий процедуру поиска параметров принято называть обучением нейросети, которая является задачей имитационного моделирования с элементами многопараметрической оптимизации.

Предлагаемая постановка задачи существенно изменяет понятие тестового возмущения, при этом для нелинейных нейрорегуляторов требуется гораздо большее число тестовых воздействий, чем для традиционных линейных регуляторов.

Имитационное моделирование позволяет анализировать качество работы АСР не только при воздействии одного детерминированного или случайного возмущения, но и при комплексном воздействии на все возможные входы и допускает одновременную и последовательную оценку качества работы и настройку на заранее спланированную реплику внесения возмущений.

При обучении нейросетей используют понятие тренировочные шаблоны. Простейшим определением тренировочного шаблона является описание желаемого значения вектора выхода нейронной сети для заданного значения вектора ее входа. В процедуре обучения нейрорегулятора значение вектора его выхода должно быть таким, чтобы на заданном интервале времени обеспечивалось оптимальное значение критерия качества работы АСР.

В характеристику шаблона следует вносить описание вида возмущения, точку его приложения в АСР, вид критерия качества и способ его вычисления.

Важным элементом настройки АСР методом имитационного моделирования является процедура вычисления критерия качества и показателя запаса устойчивости АСР. Критерий должен зависеть от искомых настроечных параметров регулятора и выбираться с учетом вносимого возмущения в конкретном шаблоне. Таким образом, из требования оптимальности для всех прогнозируемых возмущений, задача оптимизации АСР заключается в поиске таких параметров регулятора, чтобы они в средневзвешенном смысле были оптимальны для всех шаблонов.

В аналитических методах при детерминированных возмущениях, как правило, используют линейные и квадратичные интегральные критерии, которые сравнительно легко вычисляются аналитически по частотным характеристикам АСР. Однако, с точки зрения адекватного отображения качества в широком диапазоне настроечных параметров регулятора наиболее представительным для детерминированных ступенчатых возмущений является интеграл по модулю функции отклонения регулируемой величины от заданного значения y(P,X,t), где, например, для ПИ-регулятора, Р{kp , ki =kp/TИ} – вектор параметров настройки; X{l,u} – вектор возмущений по каналу регулирования l(t) и по каналу задания u(t).

Для детерминированных ступенчатых возмущений, внесенных отдельно по каналу регулирующего органа l(t) или по каналу задания u(t) , а также для одновременно внесенных по этим каналам возмущений, интеграл по модулю определяется из выражения

                                      (1)

где tp   интервал времени, на котором оценивается качество работы АСР.

При расчетах систем регулирования приходится требовать, чтобы система была не только оптимальной с точки зрения показателей качества, но и обладала определенным запасом устойчивости.

К числу наиболее известных показателей запаса устойчивости относятся степень колебательности m, определяемая расположением корней характеристического уравнения системы в комплексной плоскости, и показатель колебательности М, определяющий максимальное значение модуля КЧХ замкнутой системы относительно управляющего воздействия.

Показатель m положен в основу аналитических методов расчета настроек регуляторов по расширенным КЧХ [2], а показатель М широко используется в графоаналитических методах, в основе которых лежат КЧХ разомкнутых систем [1].

При имитационном моделировании в задачах поиска и оптимизации настроечных параметров целесообразнее использовать не косвенные показатели запаса устойчивости m и М, а прямые, определяемые непосредственно из графика соответствующего переходного процесса. К таким, для затухающих колебательных переходных процессов следует отнести степень затухания y, определяемую первой А1 и третьей А3 амплитудами колебаний:

                                                                         (2)

а также, степень перерегулирования , определяемую отношением второй амплитуды А2 к первой А1:

.                                                                        (3)

Интегральный показатель качества работы АСР и ограничение на запас устойчивости (в случае необходимости) являются составными частями функционала, оптимизируемого для тренировочного шаблона. Показатель запаса устойчивости вводится в функционал в виде функции ²штрафа².

                                (4)

где  – масштабный коэффициент, учитывающий «вес» штрафной функции.

Результаты имитационного моделирования и оптимизации различных систем регулирования показали, что глобальные экстремумы рекомендуемой целевой функции (4) (без учета ограничения на запас устойчивости) дают переходные процессы со степенью затухания y близкой к 0.9 .

Для многомерных АСР в состав функционала (4) для конкретного тренировочного шаблона следует включать показатели по всем регулируемым параметрам с учетом всех возмущающих и управляющих воздействий.

Таким образом, в предлагаемой постановке, вектор настроечных параметров регулятора Р будет оптимальным, если будет минимальной сумма функционалов (4) для всех тренировочных шаблонов:

                                    (5)

где N – число тренировочных шаблонов, bn – коэффициент, нормирующий вес n-го тренировочного шаблона (подбирается при отладке программы расчета).

Процедура поиска оптимальных настроечных параметров в многоконтурных и многомерных АСР и особенно с нейрорегуляторами требует решения сложных многопараметрических задач оптимизации. В ряде случаев такие задачи могут оказаться многоэкстремальными, для решения которых в настоящее время используются различные модификации генетических алгоритмов [3].

Краткая суть генетического алгоритма оптимизации состоит в следующем. При объяснении приведена терминология, принятая в работах по нейросетям.

1.      В пространстве поиска случайным образом задаётся популяция возможных решений (особей). Вычисляются значения вектора функции цели для всех особей.

2.      Из популяции отбираются и удаляются, например, 10% худших по значениям функции цели особей. Процент отбора может быть другим. Оставшиеся особи составляют родительскую группу.

3.      Из родительской группы случайным образом выбираются пары особей в количестве 10% от общего числа. Отобранные пары используются для генерации нового поколения решений. Новое поколение особей генерируется в результате взаимодействия хромосом родителей (кроссовер), а также случайных изменений (мутации, инверсии) хромосом.

4.      Полученное новое поколение особей добавляется в популяцию вместо удаленных в п. 2 особей. В результате формируется 100% особей нового поколения.

5.      Процедура возвращается к п.п. 2, 3 и 4. Обновление поколений продолжается до тех пор, пока во всех координатных точках значения оптимизируемой функции не будут отличаться друг от друга меньше, чем заданное малое число.

От поколения к поколению исследуемое подпространство будет сужаться. Таким образом, генетический алгоритм в исследуемом подпространстве будет случайным образом просматривать точки, выискивая среди них оптимальные в смысле целевых функций. В процессе просмотра запоминаются координаты «хороших» точек и отбрасываются координаты «плохих».

Вероятность попадания в координатную точку глобального экстремума зависит от числа случайно заданных точек (размера популяции). Обычно для задач настройки нейрорегуляторов размер популяции задается не менее 1000. При такой размерности время решения задачи может исчисляться часами.

Для уменьшения времени счета авторы предложили модификацию генетического алгоритма.

Если ввести предпосылку о том, что оптимизируемая функция цели имеет множество экстремальных точек, одна из которых является глобальным экстремумом, то для решения задачи может быть применен известный алгоритм деформируемого многогранника [4].

Алгоритм деформируемого многогранника вместо процедур генетического обновления поколений (мутации, селектирования и инверсии) целенаправленно, из каждой случайно выбранной точки, будет находить один из ближайших локальных экстремумов. Координаты найденных локальных экстремумов в данном поколении заменят отброшенные в п. 2 10% «плохих» координат. И от поколения к поколению все координатные точки текущей популяции будут находиться в локальных экстремумах. Затем при смене поколений плохие локальные экстремумы будут заменяться на хорошие и процесс будет продолжаться до тех пор, пока в очередном поколении все координаты не будит координатами глобального экстремума.

Использование алгоритма деформируемого многогранника вместо процедур генетического обновления позволяет уменьшить число неудачных шагов, что заметно приводит к снижению числа обращений к функции цели в генетическом алгоритме с деформируемым многогранником.

Оптимальный синтез иллюстрируется на примере исследования АСР температуры перегретого пара котла [1]. По предлагаемой методике сделаны расчеты одноконтурной АСР с ПИ- и ПИД-регуляторами (рис. 1а), двухконтурной АСР с контролем добавочной переменной состояния – температуры пара за пароохладителем (АСР с ПИ-регулятором и дифференциатором) (рис. 1б), а также АСР с нейрорегулятором в одноконтурной схеме (рис. 1в) и в схеме с добавочной переменной (рис. 1г).

Все схемы настроены на ступенчатые возмущения: по каналу регулирования l(t) и по каналу задания u(t). Полная реплика всех возможных комбинаций единичных возмущений показана на рис. 1д. Выбранный для примера объект регулирования является линейным, поэтому все анализируемые АСР настраивались по четырем комбинациям возмущений (1,0; 1,1; 0,1 –1, 1).

На рис. 1е показаны переходные процессы в одноконтурной АСР с параметрами ПИ-регулятора, найденными традиционным аналитическим методом и методом имитационного моделирования с помощью модифицированного генетического алгоритма оптимизации. Видно, что компромиссная настройка численным методом (кривая 4) превосходит по качеству аналитическую настройку, ориентированную на одно возмущение l(t)=1 (кривая 1) и занимает промежуточное положение между оптимальными настройками, найденными численным методом при возмущениях l(t) =1, u(t)=0 (кривая 2) и l(t) =0, u(t)=1 (кривая 3) .

На рис. 1ж показаны переходные процессы регулирования в исследованных АСР. Параметры регуляторов и синаптические коэффициенты нейрорегуляторов были найдены с использованием модифицированного генетического алгоритма оптимизации.

Рис. 1. Схемы и графики

а) – одноконтурная АСР; б) – АСР с ПИ-регулятором и дифференциатором;
в) и г) -нейрорегулятор, соответственно, с тремя и шестью входами;
д) – полная реплика комбинаций возмущений
l(t) и u(t);
е) – переходные процессы в АСР с ПИ-регулятором;
ж) – переходные процессы в АСР при компромиссных настройках
(кривая 1 – ПИ-регулятор; кривая 2 – ПИД-регулятор;
кривая 3 – ПИ регулятор и дифференциатор;
кривая 4 – нейрорегулятор с тремя входами)

Литература

1.      Ротач В.Я. Теория автоматического управления теплоэнергетическими процессами. М.: Энергоатомиздат, 1985.

2.      Стефани Е.П. Основы расчета настройки регуляторов теплоэнергетических процессов. М.: Энергия, 1972.

3.      Goldberg D.E. Genetic Algorithms in Search Optimizations and Machine Learning.-Addison.Wesly, 1989.

4.      Nelder J.A., Mead R. A simplex Method for Function Minimization, Computer J., No. 7, 1964 pp. 308–313.