Scientific journal
Fundamental research
ISSN 1812-7339
"Перечень" ВАК
ИФ РИНЦ = 1,674

OPTIMAL CONTROL IN A PREDATOR-PREY MODEL WITH LUMPED AND DISTRIBUTED DELAY

Andreeva E.A. 1 Mazurova I.S. 1
1 Tver State University
The author solves the optimal control problem in the predator-prey model with lumped and distributed delay. The mathematical model of the interaction of two populations is described by means of a system of Volterra integro-differential equations. The maximum principle for the initial continuous problem is formulated considering the defined constraints and functional form. The numerical method is developed to construct an approximate optimal control on the basis of fast automatic differentiation method. It is shown that the obtained numerical results of the approximate optimal control correspond to the maximum principle for the initial continuous problem with a prescribed accuracy. It is shown that the presence of a distributed delay in the system leads to periodic solutions and the amplitude of oscillation and the value of the minimized functional increases with increasing delay. Optimal solution is constructed for various parameters of the task and the form of minimized functional. The influence of penalty coefficients for the optimal solution is investigated.
optimal control
integro-differential equations
prey-predator model
fast automatic differentiation method
1. Andreeva E.A., Tsiruleva V.M. Variatsionnoe ischislenie i metody optimizatsii [Variational calculus and the methods of optimization], Moscow, Higher school, 2006.
2. Andreeva E.A., Dzhdeed M. Optimalnoe upravlenie sistemami, opisyvaemymi integralnymi i integro-differentsialnymi uravneniyami [Optimal control of the systems, described by integral and integro-differantial equastions], Tver, Educational book, 2003.
3. Andreeva E.A., Evtushenko Yu.G. Numerical methods for solving optimal control problems for systems described by integro-differential equations of Fredholm type [Chislennye metody resheniya zadach optimal’nogo upravleniya dlya sistem, opisyvaemykh integro-differentsial’nymi uravnniyami tipa Fredgol’ma]. Modeli i metody optimizatsii [Models and methods of optimization]. 1989, no 1, pp. 4–13.
4. Evtushenko Yu. G. Metody resheniya ekstremalnykh zadach i ikh primenenie v sistemakh optimizatsii [Methods for solving extremal problems and their applications in optimization systems], Moscow, Nauka [Science], 432 p.
5. Evtushenko Yu.G. Optimizatsiya i bystroe avtomaticheskoe differentsirovanie [Optimization and fast automation differentiation]. Scientific publ. CCAS, 2013, 144 p
6. Andreeva E.A., Mazurova I.S. Optimal control of predator-prey model with distributed delay. Mathematical Modelling and Geometry, 2013, vol. 1, no 3, pp. 38–48 – Available at: http://mmg.tversu.ru.

Математические модели, описываемые интегро-дифференциальными уравнениями, возникают при исследовании экологических, физических, экономических процессов [1, 2]. Эти модели являются неавтономными, поэтому важным вопросом является исследование периодических решений, их устойчивости и управляемости, построение оптимального управления и разработка численных методов построения приближенного оптимального решения для систем, описываемых интегро-дифференциальными уравнениями, или систем с распределенным запаздыванием.

В моделях взаимодействия популяций типа хищник жертва периодические решения могут возникать в связи с периодичностью функций, участвующих в описании процессов их зависимости от сезонов года, погоды, доступности пищи, охоты или сбора урожая.

Ранее в работе [2] рассматривалась задача управления динамической системой, описываемой интегро-дифференциальными уравнениями с сосредоточенным и распределенным запаздыванием, в которой требуется найти оптимальное управление, минимизирующее заданный критерий

andreeva01.wmf (1)

при этом управляемый процесс описывается системой интегро-дифференциальных уравнений типа Вольтерра

andreeva02.wmf (2)

а оптимальное управление удовлетворяет заданному ограничению

andreeva03.wmf п.в. t ∈ [0, T] = Γ,

andreeva04.wmf (3)

Пусть далее x1(t) и x2(t) – численность популяций жертв и хищников соответственно в момент времени t. Математическая модель взаимодействия двух популяций описывается системой интегро-дифференциальных уравнений

andreeva05.wmf

andreeva06.wmf (4)

при заданных начальных условиях

andreeva07.wmf andreeva08.wmf (5)

где ρ1 и ρ2 – величины, характеризующие скорость роста численности жертв и скорость убыли численности хищников; αi, i = 1, 2 – соревновательный фактор; G(t – τ) – плотность распределения популяции x1(t). Функции управления ui(t) – скорость отлова популяции, удовлетворяет ограничениям 0 ≤ ui(t) ≤ bi, i = 1, 2, t ∈ [0, T].

Задача оптимального управления заключается в минимизации функционала

andreeva09.wmf (6)

где функции – f0(t, x, u) – прибыль от реализации популяции, а слагаемое Φ(x(T)) отвечает за сохранность популяций.

Согласно [2] оптимальное управление удовлетворяет принципу максимума

andreeva10.wmf (7)

а сопряженные функции pi(t) являются решением системы интегро-дифференциальных уравнений

andreeva11.wmf (8)

andreeva12.wmf pi(t) º 0 при t > T. (9)

Заметим, что если andreeva13.wmf, то справедлива следующая оценка

andreeva14.wmf

В этом случае система (4)–(5) представляет собой систему дифференциальных уравнений с сосредоточенным запаздыванием

andreeva15.wmf

andreeva16.wmf

andreeva17.wmf (10)

где xi(t) = φi(t), t ∈ [–r, 0].

В этом случае оптимальное управление удовлетворяет условию (7), а сопряженные функции pi(t), i = 1, 2 являются решением системы c отклоняющимся аргументом

andreeva18.wmf (11)

При малых значениях параметра запаздывания r справедлива оценка andreeva19.wmf Система дифференциальных уравнений с запаздыванием сводится к системе обыкновенных дифференциальных уравнений (12)

andreeva20.wmf

andreeva21.wmf (12)

Ненулевое положение равновесия системы (12) существует, если β > ρ2α1, и определяется из условий

andreeva22.wmf andreeva23.wmf

Для решения задачи оптимального управления (4)–(6) в работе используется метод быстрого автоматического дифференцирования (БАД), разработанный в ВЦ РАН под руководством Ю.Г. Евтушенко [5]. Метод БАД позволяет с единых позиций определять градиенты для явно и неявно определенных функций и для вычислительных процессов, которые являются результатом дискретизации непрерывных систем, описываемых дифференциальными и интегро-дифференциальными уравнениями. На основе метода БАД разработан комплекс программ построения приближенного оптимального управления для задачи (4)–(6) и проведен численный эксперимент, результаты которого представлены ниже. В качестве критерия остановки алгоритма в работе применяются следующие условия:

1. andreeva24.wmf

2. andreeva25.wmf andreeva26.wmf

3. andreeva27.wmf andreeva28.wmf

где I(k) , x(k) , u(k) – значение минимизируемой функции, функции состояния и функции управления на k итерации соответственно.

Построим оптимальное решение задачи (4)–(6) с учетом распределенного запаздывания, в которой целью является минимизация функционала

andreeva29.wmf

отвечающего за сохранность популяции на заданном уровне в конечный момент времени.

Ниже, на рис. 1–2, представлены графики численности популяций xi(t), i = 1, 2 в зависимости от величины запаздывания r при следующих параметрах системы: α1 = 0,05, α2 = 0,05, ρ1 = 0,75, ρ2 = 0,75, β = 0,1, ui(t) ≤ 0, andreeva30.wmf , T = 45, A1 = 7, A2 = 13. Точность метода ε = 0,0000001.

pic_19.tif

Рис. 1. Графики численности популяции жертв andreeva32.wmf для управляемой системы с распределенным запаздыванием (4)–(5) в зависимости от времени t при различных значениях запаздывания r

Соответствующие этим решениям графики функции управления в зависимости от величины запаздывания r представлены на рис. 3–4.

Легко видеть, что оптимальное управление удовлетворяет принципу максимума (7). При увеличении запаздывания увеличивается значение минимизируемого функционала, уменьшается устойчивость решения.

pic_20.tif

Рис. 2. Графики численности популяции хищников andreeva33.wmf для управляемой системы с распределенным запаздыванием (4)–(5) в зависимости от времени t при различных значениях запаздывания r

pic_21.tif

Рис. 3. Графики функции приближенного оптимального управления andreeva34.wmf для системы (4)–(5) в зависимости от времени t при различных значениях запаздывания r

pic_22.tif

Рис. 4. Графики функции приближенного оптимального управления andreeva35.wmf для системы (4)–(5) в зависимости от времени t при различных значениях запаздывания r

Исследуем решение управляемой системы (4)–(5) с распределенным запаздыванием, целью управления которой является минимизация функционала

andreeva36.wmf (13)

Здесь первое слагаемое характеризует максимизацию прибыли, а второе – сохранение популяции в конечный момент времени на уровне xi(T) = Ai, i = 1, 2.

Функционал (13) можно рассматривать как сумму двух взвешенных фукционалов

andreeva37.wmf

andreeva38.wmf

В табл. 1 представлены значения минимизируемого функционала в зависимости от значения штрафного коэффициента Mk.

Из таблицы следует, что при увеличении весового коэффициента Mk от 1 до 100 величина I2opt/Mk уменьшается на 75 %, что соответствует более точному выполнению граничного условия

xi(T) = Ai, i = 1, 2.

При этом величина интегрального слагаемого уменьшается на 3,5 %.

Значения минимизируемых функционалов в зависимости от значения штрафного коэффициента Mk

Mk

0

1

10

100

I1opt

145,27

145,2621381

144,7299940

140,303468128219

I2 opt

0

0,836848968

6,59762375

20,816776

Кол-во итер.

36261

18930

619

90

Таким образом, в предлагаемой работе рассмотрена задача оптимального управления для модели хищник ‒ жертва с учетом сосредоточенного и распределенного запаздывания. Сформулирован принцип максимума для исходной непрерывной задачи, разработан алгоритм построения приближенного оптимального решения, который с заданной точностью ε = 0,0000001 совпадает с теоретическими результатами. Показано, что наличие распределенного запаздывания в системе приводит к периодическим решениям, при увеличении запаздывания увеличиваются амплитуда колебаний и значение минимизируемого функционала. Оптимальное решение построено для различных типов минимизируемых функционалов. Показано, что при увеличении штрафного коэффициента перед терминальным слагаемым значение терминального слагаемого уменьшается, что соответствует более точному выполнению условия сохранения численности популяции на заданном уровне за счет уменьшения прибыли от реализации продукции.

Рецензенты:

Болодурина И.П., д.т.н., профессор, заведующий кафедрой прикладной математики, ФГБОУ ВПО «Оренбургский государственный университет», г. Оренбург;

Попов В.Н., д.ф.-м.н., доцент, заведующий кафедрой математики Института математики, информационных и космических технологий, САФУ им. М.В. Ломоносова, г Архангельск;

Бичурин М.И., д.ф.-м.н., профессор, заведующий кафедрой ПТРА, Новгородский государственный университет, г. Нижний Новгород.

Работа поступила в редакцию 23.07.2014