Одним из важных направлений цифровизации общества является создание динамических моделей поведения индивидуумов в меняющейся социально-экономической среде. При этом надо учитывать, что существуют объекты, актуальная информация о состоянии которых не может быть получена, а разработанные в настоящее время модели не позволяют с желаемой точностью прогнозировать их поведение. К таким объектам, прежде всего, относятся отдельные личности, организации, действия (или бездействие) которых могут оказывать существенное влияние на будущее развитие всего общества. С точки зрения лауреата Нобелевской премии Ильи Пригожина [1] важным направлением в решении данной проблемы является анализ влияния малых флуктуаций на развитие общества и, в частности, анализ того, как в результате деятельности отдельных агентов вся система переходит сначала в неустойчивое, а затем новое устойчивое состояние. Пригожин считает, что нельзя строить прогноз развития только на статистических данных по множеству агентов, нужно учитывать индивидуальное поведение. Особую проблему при анализе составляет реакция системы на введение новых единиц, способных размножаться и вовлекать во взаимодействие различные процессы, протекающие в системе. Вводимые в небольшом количестве в систему новые агенты приводят к возникновению новой сети реакций между ними. Новая сеть реакций начинает конкурировать со старым способом функционирования и часто ведет к непредсказуемым последствиям. У.Б. Артур [2] задаётся вопросом, как индивидуальное поведение может ответно реагировать на сообща создаваемые индивидами типовые формы поведения (паттерны) и как эти паттерны будут изменяться в результате. Он рассматривает два основных фактора, порождающих данный процесс: индивидуальный процесс принятия решений и научно-технический прогресс. Что касается первого фактора, то один из способов смоделировать – предположить, что агенты формируют индивидуальные убеждения (возможно, несколько убеждений) или гипотезы – внутренние модели – относительно ситуации, в которой они находятся, и непрерывно их обновляют, приводя в соответствие с текущим моментом; это означает, что они постоянно адаптируются, отказываясь от тех или иных действий и стратегий и заменяя их другими, обучаясь опытным путём – осуществляя «разведывание» (explore). Влияние второго фактора – технологического прогресса проявляется в стремлении человека к экономии усилий при реализации потребностей, появляются новые более совершенные средства удовлетворения потребностей. У.Б. Артур рассматривает модель развития общества как алгоритмическую систему с непрекращающимся вычислением (computation) – в огромных масштабах рассредоточенным, характеризуемым массовым параллелизмом, стохастическим, с определенным порядком действий и последовательностью событий. Аналогичные выводы относительно использования экономической аналитики и поведенческого моделирования делает академик В.Л. Макаров [3]. В связи с вышеизложенным оказывается важным построение моделей поведения отдельных агентов и их взаимодействий, учитывающих акты восприятия действительности, действия агентов, знания агентов о самом себе и отношениях с другими агентами.
В данной работе рассматривается методология построения модели поведения индивидуума в пространственно-распределенной социально-экономической среде/ Рассматривается мультиагентная архитектура модели с интеллектуальными агентами – индивидами [4]. Мотивация любого поступка или действия индивидуума представлена в модели через его потребности [5]. При этом поведение индивида определяется совместным влиянием многих одновременно присутствующих потребностей. Часть потребностей носит императивный характер и навязана индивиду его состоянием, окружающей средой, другими индивидуумами и обусловлена, как правило, необходимостью поддержания существования самого индивида. Другая часть – потребности, представляющие стремление индивида улучшить свое текущее состояние или создать условия для его улучшения в будущем. Вне зависимости от типа потребности, который влияет на очередность их реализации, потребность может иметь собственную внутреннюю структуру, отражающую необходимость формирования и реализации других потребностей, приводящих к состоянию, необходимому для исполнения целевой потребности. Структура потребностей представляет часть общей базы знаний (БЗ) всех индивидуумов, описывающей используемые в моделируемой среде понятия, Потребности отдельного индивида представляют часть описания его текущего состояния. Разработка инструментов для моделирования поведения индивида требует типизации и создания базового набора потребностей, с помощью которого через указание параметров можно было бы задать любую конкретную потребность в материальном или информационном объекте, представленном в БЗ модели. Предложения по составу типовых абстрагированных потребностей индивидов представлены в [6–8]. Другой частью базы знаний, необходимой для моделирования поведения индивида, являются способы (рецепты) удовлетворения потребностей. Выходы в определении рецепта должны содержать типы тех самых материальных, структурных или информационных объектов БЗ, которые определяют содержание потребности. Таким образом, для каждой потребности могут быть определены рецепты, чьи выходы обеспечивают ее удовлетворение. Через указания типов на входах рецепта определяются необходимые ресурсы, средства и управляющие воздействия, необходимые для его исполнения. Кроме того, для каждого рецепта могут задаваться требования к отношениям индивидуума с элементами среды функционирования и их параметрам. В рамках предлагаемого подхода принимается, что в физическом пространстве представлены два типа элементов – материальные и нематериальные. К материальным элементам относятся: статические (неизменяемые во времени) материальные элементы, пассивные динамические элементы и активные элементы – агенты. К нематериальным относятся статические информационные элементы и отношения между ними в форме данных и знаний индивида. Типизация элементов и их взаимодействий приводит к созданию классов и объединению их в структуру, образующую основу базы знаний моделируемой предметной области. Действия агентов обусловлены возникающими потребностями (заявками). Причинами возникновения потребностей агента могут быть внутренние и внешние события или прогнозы их возникновения. Агенты могут воспринимать состояние внешней среды и взаимодействовать с ней для эффективной реализации своих потребностей. Одни потребности в случае неготовности ресурсов для исполнения могут потребовать реализации других вспомогательных потребностей. Потребность может быть удовлетворена разными способами (рецептами модели), возможно, отличающимися необходимыми ресурсами и качеством исполнения.
Рецепт реализации потребности агента
В рассматриваемой модели агенты представляют собой структуру, включающую все типы элементов пространства. Агенты обладают рецепторами, эффекторами, определенным объемом знаний и данных о себе и элементах (типах и экземплярах) внешней среды, на основании которых ими принимаются и исполняются решения (с помощью своих и\или привлеченных чужих эффекторов). Агенты обладают разными типами потребностей и объемами знаний, необходимых для их реализации. Объем знаний конкретных агентов может увеличиваться (обучение) и уменьшаться (забывание) во времени. Для представления агентов используются следующие модели: глобальная база знаний (ГБЗ), модель локальной базы знаний агента (ЛБЗ), глобальная модель истории и текущего состояния среды, локальная модель истории и текущего восприятия окружающей среды конкретным агентом [6].
Потребность агента можно представить как необходимость выполнения действия (рецепта), дающего требуемый результат в заданном интервале времени. Рецепт реализации потребности агента можно представить в виде нотации, аналогичной нотации IDEF0 (рисунок).
В качестве средств исполнения могут выступать агенты, а также статические и пассивные динамические элементы базы знаний. В качестве средств управления – агенты. В качестве входных ресурсов, результата и требуемых условий внешней среды используются любые доступные элементы, описанные в глобальной базе знаний. Все количественные ресурсы в рецептах могут иметь норматив в определенных единицах измерения.
В общем виде процесс реализации потребности, возможно, требующей предварительно удовлетворения вспомогательных потребностей, можно представить в виде И-ИЛИ графа. Каждая вершина графа – процесс удовлетворения вспомогательной потребности.
Для простых рецептов граф может быть определен заранее. В сложных предметных областях процесс реализации потребности выполняется динамически с использованием ГБЗ. В упрощенном виде модель процесса удовлетворения потребности включает поиск и выбор подходящего рецепта, подготовку и исполнение рецепта. Более подробно процесс исполнения потребности с учетом возможного появления вспомогательных потребностей имеет вид:
1. Определение множества рецептов, приводящих к удовлетворению потребности.
В список могут быть включены ранее известные агенту рецепты или найденные им при появлении потребности, имеющие в результате указанные в потребности классы элементов и их свойства. Если в потребности задан класс элементов, имеющий подклассы, то в список необходимых рецептов включаются рецепты, создающие элементы всех подклассов.
2. Масштабирование рецептов – определение необходимого объема всех входных ресурсов необходимых для выполнения рецепта. Выбор рецепта из множества удовлетворяющих потребность.
3. Если для выбранного рецепта доступны безусловно все необходимые входные ресурсы, средства исполнения, управления и удовлетворительные условия внешней среды, то захват ресурсов и средств запуск рецепта на исполнение, иначе формирование соответствующих вспомогательных потребностей. КОНЕЦ
4. Ожидание конца исполнения рецепта (возможно прерывание и временное освобождение ресурсов).
5. В момент исполнения рецепта:
– расчет и установка ожидаемого состояния выходов рецепта (пассивных элементов, агентов, отношений, состояния среды),
– освобождение использованных средств,
– если рецепт является финальным, то КОНЕЦ, иначе возврат и продолжение родительского прерванного рецепта.
Действия п. 1. п. 4 могут приводить к появлению вспомогательных потребностей. Как следует из общей схемы выполнения рецепта, ГБЗ должна включать базовый рецепт выбора любых элементов, описанных в ГБЗ. Ниже представлено описание универсального рецепта поиска и выбора объекта для удовлетворения потребности агента.
Входами рецепта выбора являются:
Id – идентификатор агента, выполняющего поиск объекта заданного типа;
Т – тип (класс потребности, агента, рецепта, входного ресурса рецепта), описанный в БЗ, для которого выполняется поиск;
MF – множество объектов типа T известных агенту из истории предыдущих поисков. По окончании поиска множество MF дополняется найденными объектами;
MG – подмножество объектов типа T доступных агенту. Зависит от состояния агента и среды на момент выполнения рецепта. Множество MG может быть задано как перечислением части объектов типа T в БД, так и логическим выражением на свойствах агента и объектов типа T. Это множество может быть расширено путем использования агентов – помощников для поиска объектов заданного типа;
UA – условие, содержащее требования агента к искомым объектам. Задается логическим выражением на описанных в БЗ свойствах типа Т и типа, которому принадлежит агент, инициировавший поиск;
UE – условие, содержащее требование среды к искомым объектам. Задается логическим выражением на свойствах типа Т.
Для выбора единственного экземпляра из найденного множества экземпляров, удовлетворяющих требованиям агента и среды, используется функция предпочтения (P).
В основу построения функции предпочтения положена теория мотивации, предложенная К. Левиным [9]. Следуя подходу К. Левина, достижимость результата можно определить через требования к ресурсам, средствам, в том числе временным, необходимым для реализации рецепта. Кроме доступности разные варианты действий (рецептов) могут обеспечивать разную валентность (ценность) результата исполнения для агента. Ожидаемая валентность результата выбора r, учитывающая субъективно оцениваемую вероятность достижения результата определяется выражением
Pr = Vr * Wr,
где Vr – ожидаемая валентность, выбора результата r,
Wr – оценка агентом вероятности достижения результата r.
Общая схема выполнения рецепта.
Этап 1. Поиск множества подходящих объектов для последующего выбора.
1. Попытка выбора объекта из множества известных агенту по результатам предыдущих поисков (использование опыта агента).
1.1. В искомое множество M включаются ранее известные и положительно оцененные объекты MF типа T, удовлетворяющие новым требованиям агента и среды:
M = MF | (Тип mi) = Т ∧ UA ∧ UE,
где mi ∈ MF.
1.2. Если M ≠ Ø – из предыдущего опыта агенту известны искомые объекты, то время выполнения рецепта равно нулю, переход к этапу 2.
2. Если среди известных агенту требуемые объекты не найдены (M = Ø):
2.1. Выбрать из множества доступных объектов MG, принадлежащих заданному типу Т и одновременно удовлетворяющих требованиям агента и среды, заданным условиями UA и UE.
M = MG | (Тип mi) = Т ∧ UA ∧ UE,
где mi ∈ MG, где mi ∈ MG – объект БД. Если объекты найдены (M ≠ Ø), то установить время выполнения рецепта, необходимое для поиска объектов и перейти к этапу 2.
2.2. Если M = Ø – требуемые объекты не найдены и дополнительные ресурсы (помощники, технические средства) еще не привлекались, то формировать потребность в привлечении дополнительного ресурса. Поиск и выбор помощника выполняется по общей схеме через формирование потребности и исполнение для нее удовлетворения рецепта выбора:
2.2.1. формирование входов для рецепта поиска и выбора помощника. Анализируя локальную БЗ агента, выясняется тип объектов, которые могут предоставить помощь в поиске нужных объектов заданного типа T и генерируется потребность, которая рекурсивно вызывает рецепт поиска и выбора с новым типом объекта поиска,
2.2.2. если помощник не найден (Mп = Ø), то требуемый объект заданного типа T не может быть выбран. Выход из рецепта поиска со значением M = Ø,
2.2.3. если помощник найден, то:
– включение его в множество известных объектов MF,
– расширение исходного множества доступных объектов MG и переход к п. 2.1.
3. Если множество M ≠ Ø, то перейти к следующему этапу 2 оценки и выбора объекта.
Этап 2. Оценка найденных объектов (M ≠ Ø).
1. Для каждого найденного объекта из M выполняется:
– расчет функции предпочтения P,
– сохранение в приобретенном опыте агента результатов поиска и выбора MF = MF ∪ M.
Этап 3. Выбор элемента из множества M по значению функции предпочтения.
Для проверки рассмотренных принципов и методов проведено моделирование процесса развития/гибели популяции, содержащей динамические активные агенты двух типов Та1 и Та2, а также объекты типа То. Агенты типа Та2 потребляют ресурсы, предоставляющие объектами типа То и, в свою очередь, предоставляют ресурсы для агентов типа Та1. Агенты Та1 в своем жизненном цикле потребляют ресурсы как агентов Та1, так и объектов То и генерируют экземпляры агентов Та2 и То, восстанавливая их популяцию. Экземпляры каждого типа имеют ограниченное время жизни, зависящее от количества отданного ресурса и потребленного ресурса. Разработка прототипа системы, реализующей указанные подходы, выполнена в среде AnyLogic. Эксперименты, выполненные с использованием модели, продемонстрировали адекватность поведения агентов в моделируемых условиях реальным действиям людей.
Выводы
В рамках проведенного исследования получены следующие результаты:
1. Определены требования к алгоритму выбора путей реализации потребностей.
2. Разработан типовой рецепт поиска и выбора необходимых объектов и рецептов, учитывающий рекурсию процесса генерации потребностей.