Scientific journal
Fundamental research
ISSN 1812-7339
"Перечень" ВАК
ИФ РИНЦ = 1,674

MODELING THE PROCESS OF INFORMATION DISTRIBUTION IN SOCIAL NETWORKS

Azhmukhamedov I.M. 1 Machueva D.A. 2 Zholobov D.A. 1
1 Astrakhan State University
2 Astrakhan State Technical University
Today, social networks are one of the most interesting phenomena and directions of research of social systems. Social networks have deeply penetrated into the life of the modern society. Communities, formed in social networks, to a large extent reflect the structure of the society, thus becoming a highly potential ground for the information influence on people. To work out management decisions in the sphere of information influence on social network users, it is necessary to be able to simulate the processes of information distribution in such networks. The methods and theory of fuzzy sets and fussy cognitive modeling are suggested for the formalization and solution of this task. The algorithm of modeling information distribution in social networks comprises several stages. The preparatory phase includes assessment of the main characteristics of the network and its users, filling up of the potential information exchange matrix, definition of the themes of interest for different categories of users, the level of their communicability and their initial attitude to the distributed information. The information block is communicated to selected users, who have a definitely positive attitude towards this theme. Afterwards, the simulation of the processes of information distribution and exchange of opinions among the network users is conducted based on the cellular automata theory, and the alteration of opinions is estimated. The statistical parameters of the distribution of the spectra of opinions for different introduced blocks reflect the moods in the social network and allow to conduct their monitoring.
social network
modeling
simulation
distribution of information
information influence
users
matrix of trust
vector of information awareness
repost indicator

Современная парадигма управления рассматривает человека как один из основных ресурсов, в значительной степени определяющий успешность любой деятельности. Данным ресурсом необходимо грамотно управлять, применяя меры институционального, мотивационного и информационного характера [14].

При этом особое место занимает информационное воздействие, которое подразумевает манипулирование составом и объемом информации, которой располагают участники того или иного процесса. Его обычно применяют для создания благоприятной и безопасной среды; поддержания и усиления авторитета руководства; манипулирования сознанием людей с целью повышения уровня мотивированности и лояльности к системе; создания атмосферы нетерпимости к нарушениям тех или иных норм поведения; повышения уровня информированности лица, принимающего решения (ЛПР); дезинформации недружественного окружения и т.д.

К достоинствам информационного управления относятся «высокая избирательность воздействия, быстрая перестройка методов и средств воздействия в зависимости от меняющейся обстановки, возможность оперативной концентрации усилий на том или ином объекте, возможность комплексного применения различных методов и средств информационного воздействия, сравнительно небольшие затраты на разработку и реализацию управленческих решений при высокой эффективности их внедрения» [8].

Наиболее полно системный подход к анализу особенностей информационного управления изложен в работах ученых ИПУ РАН [6, 9, 10].

В них вводится понятие информационного управления как «процесса выработки управленческих решений в ситуации, когда управляющее воздействие носит неявный, косвенный характер, и объекту управления представляется определенная информация о ситуации (информационная картина), ориентируясь на которую этот объект как бы самостоятельно выбирает линию своего поведения» [12].

Информационное воздействие может иметь внешний или внутренний источник возникновения (инициированный ЛПР или спонтанно возникший внутри системы), носить разовый, периодический или постоянный характер и быть направленным на конкретного человека, группу лиц или социальную подсистему в целом [10].

Одним из интереснейших направлений для изучения социальных систем в настоящее время являются социальные сети (СС). Термин «Virtual Community» (виртуальное, или сетевое, сообщество) был введен в 1993 г. Г. Рейнгольдом, который дал ему следующее определение: «Виртуальные сообщества являются социальными объединениями, которые вырастают из Сети, когда группа людей поддерживает открытое обсуждение достаточно долго и человечно, для того чтобы сформировать сеть личных отношений в киберпространстве» [15].

Технически современные СС представляют собой онлайн-сервисы – интерактивные веб-сайты, предназначенные для построения, отражения и организации социальных взаимоотношений в интернете.

Социальные сети являются на сегодняшний день важным элементом структуры современного общества, а их влияние простирается в самые разные сферы нашей жизнедеятельности: производство, повседневную жизнь, культуру, власть и т.д. СС выполняют в обществе коммуникационную, информационную, развлекательную, социализирующую функции; они предоставляют средства для самовыражения, а также обмена информацией и опытом, не имея возрастных, профессиональных или каких-либо иных ограничений. Проникновение СС в жизнь современного человеческого социума очень велико. Так, например, количество пользователей самой популярной в России СС «Вконтакте» на март 2017 года составляло более 380 млн человек [21].

Сообщества, образующиеся в социальных сетях, в значительной мере отражают структуру общества, тем самым становясь весьма перспективной площадкой для информационного воздействия на людей [13]. Высокая степень влияния информированности людей на характер их поведения предопределяет актуальность применения методов информационного воздействия на практике.

Однако эффективному применению методов информационного управления препятствует то, что, несмотря на большое число работ, посвященных изучению поведения человека и способам манипулирования им [см., например, 4, 22], практически отсутствуют формализованные модели процесса распространения информации в социальной сети.

Это связано с тем, что социальным системам имманентно присуща субъективная неопределенность. Поэтому моделирование происходящих в них процессов превращается в слабо формализуемую проблему [19].

Для ее решения необходим специальный инструментарий, позволяющий формализовывать и анализировать субъективную неопределенность (в отличие от объективной неопределенности, которая может быть описана методами и средствами теории вероятностей и математической статистики). В качестве такого инструментария целесообразно использовать аппарат теории нечетких множеств и нечеткого когнитивного моделирования [3,17].

Исходя из этого, была сформулирована задача данного исследования: разработать модель процесса распространения информации (ПРИ) в СС с целью ее дальнейшего использования для выработки управляющих решений по информационному воздействию на пользователей социальной сети (ПСС).

Модель процесса распространения информации в СС

Для описания процесса распространения информации в социальной сети предлагается следующая модель. Информационное взаимодействие в СС, состоящем из N лиц, представляется в виде распространения информации в сети S(M; D), вершинами которой служат люди M = {M1; M2; …; MN}, а множество ребер D = {Dij} отражает потенциально возможный информационный обмен между ними и образует «матрицу информационного обмена»:

agm01.wmf (1)

Необходимо отметить, что матрица Dij не обязательно должна быть симметричной. Из того, что j-ый пользователь СС делится информацией с i-ым, не следует, что последний будет делать в ответ то же самое. Вполне вероятна ситуация, при которой i-ый ПСС, получив информацию от j-го, по какой-либо причине не захочет делиться с ним своим мнением.

Получение информации i-ым элементом отражается путем изменения с 0 на 1 соответствующей координаты в векторе информированности agm02.wmf:

agm03.wmf (2)

Процесс информационного воздействия на ПСС со стороны ЛПР осуществляется следующим образом. Блок информации I, имеющий определенную тематику TI и несущий в себе вектор управляющих посылок PI (p1; p2; …), внедряется в СС через отдельных ее членов agm04.wmf с заведомо позитивным отношением к I. Множество agm05.wmf назовем инициирующим множеством (ИМ).

Межличностный информационный обмен обеспечивает распространение данной информации между пользователями СС, что способствует доведению до них вектора управляющих посылок. При этом j-ый элемент, обладающий информацией I, доносит ее до сведения i-го элемента вместе со своим мнением об этой информации.

Поскольку при этом мнения выражаются в виде вербальных оценок и представляют собой численно не измеримые величины, то для их формализации предлагается ввести лингвистическую переменную (ЛП) L «Уровень фактора» и определить терм-множество ее значений, состоящее в общем случае из 9 элементов, принадлежащих отрицательной QL- и положительной QL+ области значений:

QL = {QL- ; Н; QL+} = {Сильно отриц. (В-); Выше среднего отриц. (ВС-); Среднее отриц. (С-); Ниже среднего отрицательное (НС-); Нейтральное (низкое) (Н); Ниже среднего положит. (НС+); Среднее положит. (С+); Выше среднего положит. (ВС+); Сильно положит. (В+)} (3)

Таким образом, мнение каждого члена СС может быть оценено значением из терм-множества (3) и носить негативный (QL-) или позитивный (QL+) характер (нейтральные мнения игнорируются).

Далее необходимо построить отображение терм-множества значений ЛП на множество нечетких чисел (НЧ), заданных функциями принадлежности (ФП) на отрезке [– 1; 1] вещественной оси.

Существуют различные методы построения ФП [23, 11]. Но поскольку необходимо формализовать информацию, носящую вербальный характер, нужно подобрать метод формирования ФП таким образом, чтобы он позволял получать нечеткие числа, обладающие следующими свойствами:

  • непрерывностью (ФП µ(x) должна быть определена в любой точке x∈D, где D – область определения НЧ);
  • нормальностью (agm06.wmf);
  • унитолерантностью (agm07aa.wmf= const = 1 agm07b.wmf).

Как было показано в [11], такие свойства НЧ обеспечиваются только при формировании ФП методами назначения и корректировки параметров. Эти методы позволяют формировать трапециевидные и треугольные нечеткие числа.

Исходя из этого, в качестве семейства функций принадлежности для терм-множества лингвистической переменной L предлагается использовать девятиуровневый классификатор, в котором соответствующие функции принадлежности нечетких чисел, заданных на отрезке [– 1; 1], представляют собой трапеции:

{В– (– 1; – 1; – 0,85; – 0,75); ВС– (– 0,85; – 0,75; – 0,65; – 0,55); С– (– 0,65; – 0,55; – 0,45; – 0,35); НС– (– 0,45; – 0,35; – 0,25; – 0,15); Н (– 0,25; – 0,15; 0,15; 0,25); НС+(0,15;0,25; 0,35; 0,45); С+(0,35; 0,45; 0,55; 0,65); ВС+(0,55; 0,65; 0,75; 0,85); В+(0,75; 0,85; 1; 1)}, (4)

где в нечетком трапецеидальном числе XX (а1, а2, а3, а4): а1 и а4 – абсциссы нижнего основания; а2 и а3 – абсциссы верхнего основания трапеции.

Суть данного нечеткого классификатора в том, что если о факторе неизвестно ничего, кроме того, что он может принимать любые значения в пределах [– 1; 1] (принцип равной предпочтительности), и надо провести ассоциацию между качественной и количественной оценками фактора, то предложенный классификатор делает это с максимальной достоверностью [2].

При этом сумма всех функций принадлежности для любого x∈[– 1; 1] равна единице, что указывает на его непротиворечивость.

Построенный классификатор является разновидностью так называемой «серой» шкалы Поспелова [16], представляющей собой полярную (оппозиционную) шкалу, в которой переход от свойства А+ к свойству А– происходит плавно, постепенно. Считается, что «серые» шкалы лучше отражают экспертные оценки в условиях неопределенности [18].

Таким образом, предложенный классификатор осуществляет проекцию нечеткого лингвистического описания мнения сотрудника на отрезок [– 1;1], при этом делает это непротиворечивым способом, симметрично располагая узлы классификации [20].

Каждый пользователь СС Mk, участвующий в информационном обмене, проявляет интерес к определенному перечню тематик agm08.wmf (остальные тематики его не интересуют). При этом Mk обладает следующими имманентными свойствами:

  • собственным начальным мнением agm09.wmf относительно информации, содержащейся в I, зависящим от его индивидуальных черт характера, психологических особенностей, нравственных принципов и т.д. Данная величина оценивается экспертами значением из терм-множества (3), и ей ставится в соответствие НЧ из классификатора (4);
  • степенью доверия agm10.wmf к j-му пользователю СС в вопросах тематики TI. Данная величина также выражается значением из терм-множества (3), оценивается соответствующим НЧ из (4) и влияет на отношение Mk к информации I, полученной от j-го источника. Совокупность agm11.wmf образует «матрицу доверия» agm12.wmf по тематике TI. Матрица agm13.wmf, так же как и матрица D, не обязательно должна быть симметричной.

С учетом вышеизложенного, для оценки текущего (в дискретный момент времени t = t + 1) отношения agm14.wmf k-го ПСС к информации I после обмена мнениями с другими пользователями предлагается использовать формулы

agm15.wmf, (5)

agm16.wmf (6)

где agm17.wmf – нечеткое значение отношения Mk к информации I в дискретный момент времени (t + 1); agm18.wmf – дефаззифицированное (четкое) значение отношения Mk к информации I в дискретный момент времени (t+1) (для дефаззификации (Def) нечеткого значения используется метод «центра тяжести»); agm19.wmf – коэффициент консерватизма Mk, отражающий, насколько он полагается на собственное мнение в рамках тематики TI (agm20.wmf если agm21.wmf) (чем ближе величина agm22.wmf к 1, тем консервативнее «коллективное мнение» в рамках тематики TI).

agm23.wmf – так называемая «социальная интегральная сила» (Cumulative Social Power) [7], отражающая вклад в изменение мнения Mk информации, ставшей ему известной от окружающих в дискретный момент времени (t + 1); agm24.wmf и agm25.wmf – взвешенные по степени доверия к источнику суммы негативных и позитивных мнений, высказанных другими ПСС в дискретный момент времени (t + 1):

agm26.wmf; (7)

agm27.wmf; (8)

agm28.wmf; (9)

agm29.wmf – позитивное мнение (имеющее оценку из QL+), поступившее к Mk от j-го ПСС в момент времени (t + 1); agm30.wmf – негативное мнение (имеющее оценку из QL-), поступившее к Mk от i-го ПСС в момент времени (t + 1); agm31.wmf и agm32.wmf – количество поступивших в дискретный момент времени (t + 1) позитивных и негативных отзывов об информации I соответственно.

В качестве одного шага (такта) по времени принимается временной интервал, необходимый для единичной реализации всех коммуникационных связей, отраженных в матрице информационного обмена D.

Совокупность agm33.wmf отражает «спектр мнений» пользователей СС относительно информации I в момент времени (t + 1). Статистические параметры распределений спектров мнений для различных внедряемых информационных блоков отражают настроения в СС и позволяют проводить их мониторинг.

Согласно шкале Харрингтона, значения agm34.wmf могут быть интерпретированы следующим образом:

agm35.wmf – сильно выраженное негативное отношение, побуждающее к распространению информации I совместно со своим негативным мнением (отрицательной оценкой) (состояние ПСС S = S–).

agm36.wmf – слабо выраженное негативное (agm37.wmf) или слабо выраженное позитивное (agm38.wmf) отношение к I, не приводящее к дальнейшему распространению информации (состояние ПСС S = S 0).

agm39.wmf – сильно выраженное позитивное отношение, побуждающее к распространению информации I совместно со своим позитивным мнением (положительной оценкой) (состояние ПСС S = S +).

Вероятность того, что Mk будет распространять ставшую ему известной информацию I, зависит не только от его отношения к данной информации (от того, насколько она его эмоционально «задевает»), но и от уровня его коммуникабельности.

Для определения уровня коммуникабельности могут применяться различные тесты. Например, тест «Оценка уровня общительности» В.Ф. Ряховского, состоящий из 16 вопросов [5]. Результаты данного теста позволяют определить уровень коммуникабельности человека согласно полученным баллам. Общительность классифицируется по семи категориям: начиная от явной некоммуникабельности и заканчивая ее болезненным характером. Тест содержит вопросы непрямого характера, что исключает возможность фальсификации результатов.

Обозначим склонность Mk к распространению информации (уровень его общительности) как Ok. Данный параметр может быть оценен значением из терм-множества {Низкий; Средний; Высокий}. Тогда для нахождения значения «Индикатора передачи информации» k-ым ПСС («Индикатора репоста») agm40.wmf в дискретный момент времени (t + 1) может быть использована следующая формула:

agm41.wmf (10)

Совокупность «индикаторов передачи информации» agm42.wmf назовем «вектором репоста» agm43.wmf.

Процесс информационного обмена прекращается, если Хэммингово расстояние agm44.wmf между текущим вектором agm45.wmf и вектором agm46.wmf, полученным на предыдущем шаге по времени, не превышает некоторого заданного ЛПР значения N*:

agm47.wmf. (11)

Хэммингово расстояние agm48.wmf соответствует количеству ПСС, изменивших свое мнение между двумя последовательными шагами по времени. Когда это количество с точки зрения ЛПР становится незначительным, обсуждение информационного блока I считается завершенным.

Алгоритм моделирования

В соответствии с вышеизложенным алгоритм моделирования процесса распространения информации в СС можно представить следующим образом:

0. На нулевом (подготовительном) этапе определяются основные характеристики СС и строятся «профили ПСС» [1]. Результатом данного этапа является заполнение матрицы информационного обмена, матрицы доверия, определение «интересных» для различных категорий ПСС тематик, их начального отношения к распространяемой информации, степени их коммуникабельности и консерватизма и т.д.

1. На первом этапе моделирования, соответствующем нулевому шагу по времени (t = 0), блок информации I доводится до сведения отдельных ПСС с заведомо позитивным отношением к данной информации (элементы из множества agm49.wmf).

На данном этапе формируются:

  • начальный «вектор информированности» Z, в котором индексы информированности ПСС из инициирующего множества agm50.wmf равны 1, для остальных – 0;
  • начальный «вектор мнений» ПСС: agm51.wmf.

2. На следующем этапе происходит распространение информации и обмен мнениями между пользователями СС на шаге времени t = t + 1:

  • формируется «вектор репоста» информации I согласно формуле (10);
  • элементы, чей «индикатор репоста» равен 1, передают информацию I другим элементам согласно матрице информационного обмена D (формула 1);
  • осуществляется расчет текущего «вектора мнений» agm52.wmf по формулам (5)–(9).

3. На третьем этапе рассчитывается Хэммингово расстояние между текущим вектором agm53.wmf и вектором agm54.wmf, полученным на предыдущем шаге по времени, и проверяется выполнение условия (11). Если условие выполняется, то работа алгоритма прекращается, и полученные данные предъявляются для анализа ЛПР. Иначе происходит возврат ко второму этапу моделирования.

Заключение

Таким образом, высокая степень влияния информированности людей на характер их поведения и высокий уровень проникновения социальных сетей в жизнь современного общества предопределяют актуальность применения методов информационного воздействия на ПСС.

Предложенная в работе модель позволяет описать процесс распространения информации в социальной сети. Сформулированный алгоритм моделирования ПРИ в СС дает возможность перейти к построению системы поддержки принятия решений в данной области и его программной реализации на языке высокого уровня.