АДАПТИВНОЕ УПРАВЛЕНИЕ ЛИНЕЙНЫМИ ДВУХКАСКАДНЫМИ ОБЪЕКТАМИ (ЗАДАЧА СЛЕЖЕНИЯ)

Мышляев Ю.И. 1 Тар Яр Мьо 1 Пью Чжо Кхаунг 1

1 Московский государственный технический университет имени Н.Э. Баумана Калужский филиал

В работе рассматривается задача обеспечения желаемой динамики конечного каскада и ограниченности траекторий замкнутой системы. Желаемая динамика конечного каскада задается явной BIBO устойчивой эталонной моделью с ограниченной производной задающего воздействия. Для синтеза алгоритмов адаптивного управления используется трехэтапная методика скоростного биградиента. На первом этапе в условиях полной априорной информации об объекте синтезируется «идеальное» виртуальное управление конечным каскадом, обеспечивающее достижение цели управления. На втором этапе неизвестные параметры «идеального» виртуального управления заменяются настраиваемыми и синтезируется алгоритм адаптации. Особенность синтеза – в использовании алгоритмов адаптации в конечной (недифференциальной) форме, что позволяет обеспечить более быстрое парирование координатных возмущений. На третьем этапе формируется отклонение от пересечения гиперповерхностей в форме невязки между выходным сигналом входного каскада и виртуальным управлением. Синтезируется управление, обеспечивающее достижение настраиваемого многообразия гиперповерхностей. Синтезированы гладкий, релейный и комбинированный алгоритмы управления с настраиваемым многообразием. Приводятся условия достижимости цели управления для синтезированного класса алгоритмов адаптивного управления. Рассмотрен пример синтеза и результаты математического моделирования.

Статья в формате PDF

0 KB

адаптивное управление

метод скоростного биградиента

настраиваемый скользящий режим

устойчивость

функция Ляпунова

1. Мышляев Ю.И. Алгоритмы управления линейными объектами в условиях параметрической неопределённости на основе настраиваемого скользящего режима // Мехатроника, автоматизация, управление. – 2009. – № 2. – С. 111–116.

2. Мышляев Ю.И. Метод бискоростного градиента // Известия ТулГУ. Технические науки. – Вып. 5: в 3 ч. Ч. 1. – Тула: Изд-во ТулГУ, 2011. – С. 168–178.

3. Мирошник И.В., Никифоров В.О., Фрадков А.Л. Нелинейное и адаптивное управление сложными динамическими системами. – СПб.: Наука, 2000.

4. Фрадков А.Л. Адаптивное управление в сложных системах. – М.: Наука, 1990.

5. Myshlyayev Y.I., Finoshin A.V. The speed bi-gradient method for model reference adaptive control of affine cascade systems // 1st IFAC Conference on Modeling, Identification and Control of Nonlinear Systems MICNON 2015. – Saint Petersburg, Russia, 24–26 June 2015, IFAC–PapersOnLine: Volume 48, Issue 11, 2015, P. 489–495.

В работе [1] предложена методика синтеза адаптивных систем управления на основе метода скоростного биградиента с алгоритмами адаптации параметров многообразия скольжения в дифференциальной форме. При реализации этих алгоритмов требуется блок интеграторов размерности вектора настраиваемых параметров. В данной работе предлагается использовать алгоритмы адаптации в конечной (недифференциальной) форме. Для линейных объектов управления представлена постановка задачи слежения с явной эталонной моделью конечного каскада. Рассмотрена методика синтеза класса алгоритмов адаптивного управления, сформулированы условия работоспособности алгоритмов. Приведены результаты анализа качества замкнутой системы с гладкими и релейными алгоритмами скоростного биградиента с подсистемой адаптации математического моделирования.

Постановка задачи

Рассматривается каскадная модель объекта управления (ОУ), состоит из подсистемы вывода S1 и подсистемы ввода S2 в регулярной форме

myshlyaev01.wmf

myshlyaev02.wmf (1)

где myshlyaev03.wmf x2 ∈ Rm; u ∈ Rm – векторы состояния подсистем и управления соответственно; Aij(ξ) (i, j = 1, 2), B2(ξ) – постоянные матрицы, причем det B2 ≠ 0; ξ ∈ Ξ – множество вариантов неизвестных параметров объекта управления (ОУ).

Целью управления является ограниченность всех траекторий системы и достижения целевого неравенства

Q(e) ≤ Δe при t ≥ t*, (2)

где Δe ≥ 0; t* ≥ 0; Q(e) – локальный (неинтегральный) целевой функционал вида

myshlyaev04.wmf (3)

где e = x1 – x1 – ошибка слежения; xЭ1 – желаемое состояние подсистемы S1, H = HT > 0.

Зададим желаемую динамику для конечного каскада с помощью явной эталонной модели вида

myshlyaev05.wmf myshlyaev06.wmf (4)

где A* – гурвицевая матрица; r – гладкая, ограниченная, вместе со своей производной вектор-функция.

Синтез алгоритмов адаптации в конечной форме

Проведем синтез алгоритма управления методом скоростного биградиента (МСБГ) [2].

Этап 1. На первом этапе в условиях полной априорной информации об объекте синтезируется «идеальное» виртуальное управление конечным каскадом, обеспечивающее достижение цели управления

myshlyaev07.wmf (5)

где θ* = θ(ξ) – m×(n – m) матрица; D* = D(ξ) – m×n матрицы идеальных параметров.

Определим производную по времени от целевой функции (3) в силу уравнений системы (1), (4) с учётом (5) при myshlyaev08.wmf :

myshlyaev09.wmf (6)

Идеальные параметры θ*, D* выберем из условий

myshlyaev10.wmf myshlyaev11.wmf (7)

так что myshlyaev12.wmf myshlyaev13.wmf myshlyaev14.wmf – псевдообратная матрица.

Получаем

myshlyaev15.wmf ,

где myshlyaev16.wmf – матрица H = HT > 0 удовлетворяет уравнению Ляпунова myshlyaev17.wmf . Следовательно, достигается цель управления x1 → xЭ1 при t → ∞. Из гурвицевости матрицы A* и ограниченности задающих воздействий myshlyaev18.wmf следует ограниченность xЭ1, x1.

Этап 2. На втором этапе неизвестные параметры «идеального» виртуального управления заменяются настраиваемыми, и синтезируется алгоритм адаптации.

Заменим в выражении (5) идеальные параметры θ*, D* настраиваемыми θ, D. Получим виртуальное управление вида

x2virt = –θx1 + Dr. (8)

Вычислим производную по времени от целевой функции (3) в силу уравнений системы (1), (4) с учётом (8) при myshlyaev19.wmf

myshlyaev20.wmf

Вычисляя градиенты функции по настраиваемым параметрам θ, D от функции w(e, θ, D) и выбирая алгоритм адаптации в конечной форме (недифференциальной), получаем

myshlyaev21.wmf

myshlyaev22.wmf (9)

где myshlyaev23.wmf γi > 0, myshlyaev24.wmf – коэффициенты усиления алгоритмов адаптации; θ0, D0 – матрицы априорных оценок (могут быть выбраны нулевыми).

Этап 3. На третьем этапе формируется отклонение от пересечения гиперповерхностей в форме невязки между выходным сигналом входного каскада и виртуальным управлением. Синтезируется управление, обеспечивающее достижение многообразия гиперповерхностей.

Выберем отклонение от пересечения многообразий гиперповерхностей σ ≡ 0 в форме невязки между входом подсистемы S2 и настраиваемым виртуальным управлением x2virt так, что

σ = x2 – x2virt. (10)

Введем дополнительный целевой функционал (ЦФ), характеризующий отклонение траектории системы от пересечения многообразий

R(σ) = 0,5σTσ. (11)

Вычислим скорость изменения ЦФ (11)

myshlyaev25.wmf (12)

где

myshlyaev26.wmf

Семейство алгоритмов, обеспечивающее достижение целевого неравенства

R(σ) ≤ Δσ при t ≥ tσ, (13)

имеет вид [3, 4]

u = u0 – γmφ(σ), (14)

где u0 – априорное заданное управление, которое может быть равно нулю; вектор-функция φ(σ) ∈ Rm удовлетворяет условию усиленной псевдоградиентности:

myshlyaev27.wmf

где β > 0, δ = 1, 2, ... – некоторые числа; myshlyaev28.wmf – градиент функции μ(σ, u) по управлению u.

Условию усиленной псевдоградиентности удовлетворяют, например, функции

myshlyaev29.wmf

при δ = 1, myshlyaev30.wmf

myshlyaev31.wmf при δ = 2, β = λmin(Γm),

где myshlyaev32.wmf – (2×2) матрицы усилителя; λmin(Γm) – минимальное собственное значение Γm.

При u = 0 получаем гладкие и релейные алгоритмы вида

myshlyaev33.wmf (15)

myshlyaev34.wmf (16)

Заметим, что алгоритм (15) относится к классу систем с настраиваемым скользящим режимом [2, 5].

Утверждение. Для системы (1), (4), (8), (9), (10) с алгоритмом управления (15) или (16) справедливы следующие утверждения:

1. Для системы с алгоритмом управления (15) существуют myshlyaev35.wmf , myshlyaev36.wmf такие, что при myshlyaev37.wmf , myshlyaev38.wmf цели управления (2), (13) достигаются при любых Δe > 0, Δσ > 0, все траектории системы ограничены. Существует момент времени t*, такой, что R(σ(t)) ≡ 0 (σ(t) ≡ 0) при t ≥ t*. При γi → ∞ цель управления (2) предельно достижима, т.е. Q(e) → 0 при t → ∞.

2. Для системы с алгоритмом управления (16) существуют myshlyaev39.wmf , myshlyaev40.wmf такие, что при myshlyaev41.wmf , myshlyaev42.wmf цели управления (2), (13) достигаются при любых Δe > 0, Δσ > 0, все траектории системы ограничены. При γi → ∞, γm → ∞ справедливо R(σ) → 0, Q(e) → 0 при t → ∞.

3. Для замкнутых систем с алгоритмами (15), (16) существует функция Ляпунова вида

V(e, σ, θ) = Q(e) + R(σ). (17)

Из утверждения следует, что гладкий алгоритм управления обладает более слабыми свойствами сходимости, поэтому его предпочтительнее использовать в комбинации с релейным алгоритмом. При этом в замкнутой системе достигается асимптотическая устойчивость (e, σ) → ∞ при t → ∞.

Пример и результаты моделирования алгоритмов управления с адаптацией в конечной форме

Пусть объект управления описывается уравнением

myshlyaev43.wmf

myshlyaev44.wmf

где aij (i, j = 1, 2), b2 – параметры ОУ (b2 > 0, a12 > 0).

Цель управления

Q(e) ≤ Δe при t ≥ t*,

где e = x1 – xЭ1.

Желаемое поведение системы в соответствии c (4) зададим уравнением

myshlyaev45.wmf xЭ1(0) = –1,

где myshlyaev46.wmf – задающее воздействие.

Алгоритм адаптации в конечной форме имеет вид

myshlyaev47.wmf myshlyaev48.wmf

Алгоритм управления

myshlyaev49.wmf

где myshlyaev50.wmf , γm > 0.

На рис. 1–5 приведены результаты моделирования системы с алгоритмом адаптивного управления при начальных условиях θ(0) = –0,5; d(0) = 0,1 параметрах объекта управления a11 = 1, a12 = 2, a21 = 1, a22 = 3, b2 = 1, параметрах адаптера для конечной формы γ1 = 22, γ1 = 35.

pic_21.tif

Рис. 1. Графики выходного сигнала объекта управления и эталонной модели

pic_22.tif

Рис. 2. Графики управления

pic_23.tif

Рис. 3. Графики отклонений от многообразия гиперповерхностей

pic_24.tif

Рис. 4. Графики идеальных θ* и настраиваемых θ параметров

pic_25.tif

Рис. 5. Графики идеальных d* и настраиваемых d параметров

Результаты математического моделирования системы с управлением в релейной форме с конечным алгоритмом адаптации многообразия скольжения подтверждают достижение цели управления (ограниченность траектории и обеспечения желаемой динамики конечного каскада с конечной точностью). Повышение точности слежения может быть обеспечено увеличением коэффициентов усиления контура адаптации (γ1, γ2). Алгоритмы адаптации параметров многообразия скольжения не обладают идентифицирующими свойствами.

Заключение

В работе представлена методика синтеза адаптивных систем управления для линейных объектов на основе скоростного биградиента с алгоритмами адаптации параметров многообразия скольжения в конечной (недифференциальной) форме. Алгоритм адаптации в конечной форме обеспечивает быстрое (по сравнению с алгоритмами адаптации в дифференциальной форме [1]) парирование координатных возмущений (ошибки слежения) конечного каскада. Релейный алгоритм управления обеспечивает возникновение в замкнутой системе настраиваемого скользящего режима. Гладкий алгоритм обеспечивает стремление траекторий замкнутой системы в ε – окрестность настраиваемого многообразия и асимптотическое стремление к многообразию при бесконечно большом коэффициенте усиления. Поэтому предпочтительно использовать гладкий алгоритм в сумме с релейным алгоритмом.

Работа выполнена при финансовой поддержке РФФИ и Правительства Калужской области (грант № 14-48-03115).

Библиографическая ссылка

Мышляев Ю.И., Тар Яр Мьо, Пью Чжо Кхаунг АДАПТИВНОЕ УПРАВЛЕНИЕ ЛИНЕЙНЫМИ ДВУХКАСКАДНЫМИ ОБЪЕКТАМИ (ЗАДАЧА СЛЕЖЕНИЯ) // Фундаментальные исследования. 2016. № 3-1. С. 37-41;
URL: https://fundamental-research.ru/ru/article/view?id=40002 (дата обращения: 07.02.2026).

Научный журнал
Фундаментальные исследования

ISSN 1812-7339

"Перечень" ВАК

ИФ РИНЦ = 1,798

АДАПТИВНОЕ УПРАВЛЕНИЕ ЛИНЕЙНЫМИ ДВУХКАСКАДНЫМИ ОБЪЕКТАМИ (ЗАДАЧА СЛЕЖЕНИЯ)

Библиографическая ссылка

Фундаментальные исследования
Научный журнал | ISSN 1812-7339 | ПИ №ФС77-63397