Scientific journal
Fundamental research
ISSN 1812-7339
"Перечень" ВАК
ИФ РИНЦ = 1,749

OPTIMAL CONTROL OF MOVABLE OBJECT STEP OF THE DISTURBANCE

Yakovenko P.G. 1
1 Tomsk polytechnic university, Tomsk
Synthesis of real-time microprocessor means optimal control of moving objects when you change jobs, parameters, and disturbing effects during the transition processes should be carried out simulations using algorithms based on the repeated numerical solution of differential equations taking into account the technological requirements and restrictions. Traditional read-time synthesis of optimal moving tracks by microprocessor units is not always effective. It is desirable to use new methods. To solve this problem the method of continuos multistep synthesis of optimal control laws for both linear and non-linear systems was developed. It is based on elements of dynamic programming and simulating methods, on the principles of «change targeting», and «leading week element». Optimal control is searching for small periods of time by counting test steps, after that object returns to the steady state. Designed algorithms could be used when creating microprocessor control systems in ship-building, aviation and space technique.
method
synthesis control
systems
limited coordinates
1. Bellman R. Dinamisheskoe programmirovanie. M.: Ipd. Inost. lit., 1960, 400 р.
2. Myasnikov V.A., Ignatev M.B., Pokrovskii A.M. Programmnoe upravlenie oborudovaniem. L.: Mashinostroenie, Leningr. otd., 1974, 540 р.
3. Yakovenko P.G. Metodika posledovatelnogo mnogoshagovogo sintesa optimalnix upravlenii. Izvestiya TPU, 2003, t. 306, no. 2, pр. 95–98.
4. Yakovenko P.G. Sintez optimalnix upravlenii podvishnimi obektami vo vremya perexodnix prozessov. Izvestiya Ushnogo federalnogo universiteta. Texnisheskie nauki. Taganrog: UFU, 2008, no. 12, pр.. 63–73.
5. Yakovenko P.G. Upravlenie perexodnimi prozessami v sistemax s ogranisheniem koordinat. Vestnik Tomskogo gosudarstvennogo universiteta. Matematika i mexanika. Tomsk: TGU, 2008, no. 3(4), pр. 42–52.

Применение микропроцессорной техники для управления переходными процессами требует разработки алгоритмов синтеза в реальном масштабе времени с высокой частотой управляющих воздействий, с учетом возможного изменения во время переходного процесса параметров подвижного объекта, заданий и возмущающих воздействий при строгом выполнении ограничений. Выполнение ограничений достигается, если удается правильно прогнозировать поведение системы при известных управляющих воздействиях. Использование для этих целей традиционных методов синтеза оптимальных управлений сложными динамическими системами не всегда оправдано [1].

Постановка задачи

Модели подвижных объектов должны отражать их свойства в установившихся и в переходных режимах. Для эффективного управления в большинстве случаев оказывается достаточным получение оптимальных законов на точных математических моделях с учетом технологических требований и ограничений координат [2]. Эти результаты в дальнейшем могут использоваться при программном управлении подвижными объектами после измерения ступенчатых возмущающих воздействий. Требования к алгоритму управления объектом в этом случае оказываются не высокие. Возможен и синтез средствами микропроцессорной техники оптимальных управлений в реальном масштабе времени.

Рассмотрим управление подвижным объектом, модель которого представляется системой обыкновенных дифференциальных уравнений

 (1)

где X1, X2, X3, X4, X5 - координаты системы; F - возмущающее воздействие; t - время. Управление выходной координатой X1, соответствующей перемещению объекта, осуществляется дискретным входным воздействием U, модуль которого не может превышать значения Uм. Необходимо синтезировать микропроцессорными средствами закон изменения управляющего воздействия, обеспечивающего оптимальный по быстродействию переход без перерегулирования по положению подвижного объекта из любого начального состояния в заданное состояние.

Методика последовательного многошагового синтеза оптимальных управлений

Разработана методика синтеза оптимальных управлений линейными и нелинейными системами [3, 4, 5]. Оптимальный закон составляется из управлений, найденных во время переходного процесса для малых интервалов времени. На начальном этапе рассчитывается прогнозируемое оптимальное управление для очередного шага. Это управление в дальнейшем может быть скорректировано. Затем определяются координаты системы в результате выполнения пробного шага с найденным прогнозируемым управлением. На следующем этапе методом имитационного моделирования выполняется перевод системы по оптимальному закону с учетом принятых ограничений из состояния, полученного в результате выполнения пробного шага, в равновесное состояние.

Сравниваются значения координат системы при переводе ее по оптимальному закону в равновесное состояние с допустимыми значениями координат. Если нет нарушений принятых ограничений, то использованное на пробном шаге управление считается оптимальным и его следует применить для расчета реальных координат системы на очередном шаге. Если наблюдаются нарушения ограничений после перевода системы в равновесное состояние, то использованное на пробном шаге управление не является оптимальным, его следует скорректировать и повторить расчеты по описанному циклу. Оптимальные управления на отдельных шагах составляют в конечном итоге оптимальный закон управления подвижным объектом с учетом ограничений.

Алгоритм управления подвижным объектом

Рассмотрим алгоритм последовательного многошагового синтеза оптимального по быстродействию управления подводным подвижным объектом при перемещении без перерегулирования по глубине, с дискретным изменением управляющего воздействия. Для поиска управления воспользуемся расчетом пробных шагов, выполняемых с предельными динамическими возможностями в сторону увеличения скорости объекта с целью скорейшего достижения заданной глубины и последующими переводами его в равновесное состояние. Для определения управления на каждом шаге используем методы имитационного моделирования и динамического программирования.

Определим оптимальное управление U(t), обеспечивающее минимальное время перевода объекта из исходного состояния X1i(0) = X1нач, X2i(0) = 0, X3i(0) = 0, X4i(0) = 0, X5i(0) = 0, Fi(0) = 0 в заданное состояние состояния X1(T) = X1z, X2(T) = 0, X3(T) = 0, X4(T) = 0, X5(T) = -F. Решение задачи с помощью предложенной методики предполагает, что речь идет о системе с квантованием координат по уровню и по времени. Объект описывается системой разностных уравнений

 (2)

где ΔX1, ΔX2, , ΔX4 и ΔX5 приращения координат объекта за шаг интегрирования Δt. Определение оптимального по быстродействию управления на очередном реальном шаге начинается с расчета управления Up1, обеспечивающего максимальное приращение координаты X1 на первом пробном шаге.

 (3)

Рассчитываются координаты объекта X1p1, X2p1, X3p1, X4p1 и X5p1 после выполнения первого пробного шага с управлением Up1.

(4)

Осуществляется проверка возможности выполнения аналогичного шага в реальной системе. Процедура начинается с задания начальных условий координатам X1p2, X2p2, X3p2м1, X4p2м1, X5p2м1 для второго пробного шага, которые принимают значения, полученные после выполнения первого пробного шага.

X1p2 = X1p1; X2p2 = X2p1; X3p2м1 = X3p1;

X4p2м1 = X4p1; X5p2м1 = X5p1. (5)

Определяется оптимальное управление Up2 на втором пробном шаге.

 (6)

Рассчитываются координаты объекта X1p2, X2p2, X3p2, X4p2 и X5p2 после выполнения второго пробного шага с управлением Up2.

 (7)

Задаются начальные условия для выполнения третьего пробного шага

X1p3 = X1p2, X2p3 = X2p2, X3p3 = X3p2,

X4p3м1 = X4p2, X5p3м1 = X5p2. (8)

Методом динамического программирования последовательно от выхода к входу объекта определяется оптимальное по быстродействию управление Up3 на третьем пробном шаге.

 (9)

Последовательно от входа к выходу модели объекта рассчитываются координаты X1p3, X2p3, X3p3, X4p3 и X5p3 после выполнения третьего пробного шага с управлением Up3. Задаются начальные условия для выполнения четвертого пробного шага.

(10)

X1p4 = X1p3, X2p4 = X2p3, X3p4 = X3p3, X4p4 = X4p3, X5p4м1 = X5p3. (11)

Определяется оптимальное управление Up4 на четвертом пробном шаге.

 (12)

Последовательно рассчитываются координаты X1p4, X2p4, X3p4, X4p4 и X5p4 после выполнения четвертого пробного шага с управлением Up4.

(13)

Задаются начальные условия для выполнения пятого пробного шага

X1p5 = X1p4, X2p5 = X2p4, X3p5 = X3p4, X4p5 = X4p4, X5p5 = X5p4. (14)

Определяется оптимальное по быстродействию управление Up5 на пятом пробном шаге.

 (15)

Рассчитываются координаты объекта X1p5, X2p5, X3p5, X4p5 и X5p5 после выполнения пятого пробного шага с управлением Up5.

(16)

В равновесном состоянии значение координаты X5p5 должно быть равно значению возмущающего воздействия с обратным знаком -F. Если это условие не выполняется, то рассчитывается по выражениям (15) и (16) следующий пятый пробный шаг с ранее полученными новыми начальными условиями.

После выполнения условия X5p5 = -F оценивается значение координаты X4p5. В равновесном состоянии значение координаты X4p5 должно быть равно нулю. Если это условие не выполняется, то рассчитывается по выражениям (12) и (13) следующий четвертый пробный шаг с ранее полученными новыми начальными условиями. Затем по выражениям (14), (15) и (16) изменяется координата X5p5 до значения -F. Таким способом обеспечивается одновременное получение значений координат X4p5 и X4p5 в равновесном состоянии.

После выполнения условий X5p5 = -F и X4p5 = 0 оценивается значение координаты X3p5. В равновесном состоянии значение координаты X3p5 должно быть равно нулю. Если это условие не выполняется, то рассчитывается по выражениям (9) и (10) следующий третий пробный шаг с ранее полученными новыми начальными условиями. Затем по выражениям (11)-(16) изменяются координаты объекта X5p5, X4p5 и X3p5 до значений, соответствующих значениям этих координат в равновесном состоянии.

После выполнения условий X5p5 = -F, X4p5 = 0 и X3p5 = 0 оценивается значение координаты X2p5. В равновесном состоянии значение координаты X2p5 должно быть равно нулю. Если это условие не выполняется, то рассчитывается по выражениям (6) и (7) следующий второй пробный шаг с ранее полученными новыми начальными условиями. Затем по выражениям (8)-(16) с помощью ранее описанной методики изменяются координаты объекта X5p5, X4p5, X3p5 и X2p5 до значений, соответствующих значениям этих координат в равновесном состоянии.

После выполнения условий X5p5 = -F, X4p5 = 0, X3p5 = 0 и X2p5 = 0 оценивается значение координаты X1p5. Если значение X1p5 превысит значение X1z, то управление U реальным объектом на очередном шаге принимает значение -Up1. Если значение X1p5 не превышает заданное значение X1z, то управление U реальным объектом на очередном шаге принимает значение Up1 с первого пробного шага.

Рассчитываются координаты реального объекта X1i, X2i, X3i, X4i и X5i после выполнения очередного шага с найденным управлением U.

 (17)

Для последующих шагов синтез управления выполняется по аналогичной методике. Оптимальное время перевода объекта из исходного состояния X1(0) = 0,99, X2(0) = 0, X3(0) = 0, X4(0) = 0, X5(0) = 0, F(0) = 0 в заданное состояние состояния X1(T) = 1, X2(T) = 0, X3(T) = 0, X4(T) = 0, X5(T) = 0,1 при F(T) = -0,1 и Uм = 1 составило 5,508 с. Изменение в широких пределах параметров объекта и ограничений не нарушает работоспособности алгоритма.

Заключение

Методика последовательного многошагового синтеза позволяет синтезировать микропроцессорными средствами в реальном масштабе времени оптимальные управления высокоскоростными подвижными объектами, автоматизировать сложные производственные процессы, исследовать предельные динамические возможности нелинейных систем высокого порядка с ограничением координат.

Рецензенты:

  • Кориков А.М., д.т.н., профессор Томского государственного университета систем управления и электроники, г. Томск;
  • Светлаков А.А., д.т.н., профессор Томского государственного университета систем управления и электроники, г. Томск.

Работа поступила в редакцию 12.04.2012.