Scientific journal
Fundamental research
ISSN 1812-7339
"Перечень" ВАК
ИФ РИНЦ = 1,674

ANALYSIS OF MARKETING COMMUNICATIONS WITH NON-LINEAR DATA VISUALIZATION METHODS

Mikhalkevich I.S. 1
1 Financial University under the Government of the Russian Federation (Financial University)
There are different data mapping methods useful in different cases such as regularity detection in the data, target predictors selection, formal rationale of its implementation in regression model, and interpretation of characteristics for decision-making support. This article presents a study of marketing communications outcome using variety of methodologies: simple statistical methods, kohonen’s self-organizing maps and the elastic maps. Author produce qualitative comparison of methodologies by cluster evaluation. The paper shows how non-linear data mapping techniques allow us to estimate the number of clusters and select the appropriate partitioning. The analysis revealed basic laws and key characteristics, which directly affect the marketing communications outcome. The results can be used to predict marketing communications outcome, as well as to support of decision-making.
data mapping
data visualization
marketing communications
1. Ajvazjan S.A., Buhshtaber V.M., Enjukov I.S., Meshalkin L.D. Prikladnaja statistika. Klassifikacija i snizhenie razmernosti. Spravochnoe izdanie. Pod red. S.A. Ajvazjana. M.: Finansy i statistika, 1989.
2. Ajvazjan S.A., Enjukov I.S., Meshalkin L.D. Prikladnaja statistika. Statisticheskoe ocenivanie zavisimostej. M.: Finansy i statistika, 1985.
3. Voroncov K.V., lekcii kursa «Mashinnoe obuchenie», yandexdataschool.ru, 2016.
4. Dejvson M. Mnogomernoe shkalirovanie: Metody nagljadnogo predstavlenija dannyh. M.: Finansy i statistika, 1988.
5. Zinovev A.Ju. Vizualizacija mnogomernyh dannyh. Krasnojarsk: Izd-vo KGTU, 2000.
6. Zinov’ev A.Ju., Metod uprugih kart dlja vizualizacii dannyh: algoritmy, programmnoe obespechenie i prilozhenija v bioinformatike. Krasnojarsk: IVM SO RAN, 2001.
7. Kotler F. Marketing menedzhment / Per. s angl. pod red. O.A. Tretjak, L.A. Volkovoj, Ju.N. Kanturevskogo. SPb.: Piter, 1999.
8. Terehina A.Ju. Analiz dannyh metodami mnogomernogo shkalirovanija. M.: Nauka, 1986.
9. Kohonen T. Self-Organizing Maps, Berlin. New York: Springer-Verlag, 2001.

Простейшие методы анализа маркетинговых коммуникаций

С точки зрения маркетинговых коммуникаций целевым оптимизируемым показателем является конверсия. Конверсия понимается, как отношение числа участников маркетинговой коммуникации, выполнивших целевое действие, к их общему числу [7]:

mihalrev01.wmf

где Convi – конверсия в группе, обладающей i-м признаком; TSi – количество успешных попыток коммуникации по группе; TFi – количество безуспешных попыток коммуникации по группе.

Отображение значимости признаков с точки зрения конверсии можно представить графически с использованием системы простых показателей.

Количество клиентов, обладающих данным признаком, или их доля:

mihalrev02.wmf

где Pi – доля клиентов, обладающих признаком i; Vi – количество клиентов, обладающих признаком i; V – общее количество клиентов в группе.

Распространённость признака в целевой группе – доля целевых клиентов, обладающих данным признаком:

mihalrev03.wmf

где Si – доля клиентов, обладающих признаком i, в целевой группе; pi – количество клиентов в целевой группе, обладающих признаком i; TS – количество клиентов в целевой группе (успешных попыток коммуникации).

Таким образом, можно вывести коэффициент характерности признака, показывающий, насколько этот признак более или менее характерен для целевого клиента, чем для группы в целом:

mihalrev04.wmf

где Сi – коэффициент характерности признака i для целевой группы, показывает ценность обладания информацией о факте присутствия признака i.

По результатам проведения маркетинговой кампании был составлен портрет потенциального лизингополучателя, который был описан при помощи полученных выше метрик (рис. 1).

Помимо основных признаков были выявлены синтетические признаки, состоящие из совокупности условий (рис. 2).

pic_124.tif

Рис. 1. Анализ основных характеристик клиента

pic_125.tif

Рис. 2. Анализ синтетических характеристик клиента

Таким образом, самая ценная информация о клиенте с точки зрения отклика на маркетинговые коммуникации звучит следующим образом «клиент совершает покупки в среднем раз в 19–77 дней», однако таких клиентов всего 2 %.

Информация о том, что выручка клиента составляет менее 850 000 рублей, говорит о том, что, скорее всего, клиент не склонен к покупке, причём данная информация имеется о 40 % респондентов, что является относительно хорошим показателем.

Итоговый портрет целевого клиента будет звучать следующим образом «клиент часто совершает покупки, недавно что-либо покупал или интересовался покупкой, пришёл от дилера и имеет выручку от 8,5 до 34 млн руб.». Очевидно, что таких клиентов либо крайне мало, либо не существует вовсе. Однако такой портрет позволяет дать ориентиры в стратегическом планировании и при подготовке очередных маркетинговых кампаний.

Использование нелинейных методов отображения данных в анализе маркетинговых коммуникаций

Целесообразно рассмотреть методы, которые в настоящее время позволяют визуально представить сразу всю структуру многомерного набора данных.

Под визуализацией данных в таком случае будет пониматься способ отображения многомерного массива данных на двумерной плоскости, где по меньшей мере качественно выражены основные закономерности исходного распределения. Это могут быть такие закономерности, как кластерная структура, топология, различные зависимости между признаками, расположение точек данных в пространстве и пр. [5].

Основные цели применения нелинейных методов визуализации:

– наглядное геометрическое представление данных;

– описание закономерностей в данных;

– сжатие информации;

– восстановление пропущенных значений;

– прогнозирование и построение регрессионных моделей.

Традиционными методами решения поставленных задач являются целенаправленное проецирование и многомерное шкалирование. Методы целенаправленного проецирования сводятся к поиску отображения данных из многомерного пространства на двумерную плоскость, оптимизирующему функционал от координат точек данных [1]. В задачах, решаемых методами многомерного шкалирования, отсутствуют исходные данные о координатах точек данных, известны только расстояния между ними. Задача сводится к поиску таких координат точек, которые будут сохранять матрицу расстояний [2, 4, 8].

Относительно новыми средствами визуализации данных являются самоорганизующиеся карты Кохонена [9], а также упругие карты, разработанные в Институте вычислительного моделирования г. Красноярска [6]. Методы, используемые этими средствами, основаны на поиске оптимальной ориентации вложенных поверхностей в многомерной структуре данных.

В методе самоорганизующихся карт Кохонена точки данных проецируются на сетку узлов, итеративно приближенных к сгущениям точек данных, при достижении минимума ошибки аппроксимации:

mihalrev05.wmf

где yBMU(Xi) – ближайший узел к точке данных Xi.

Узлы сетки инициализируются и перемещаются по направлению к точкам данных по следующему правилу:

(yj)′ = yj + h(r(yj, yBMU), t)(Xi – yi), j = 1…p,

где h(x, t) – функция соседства узлов; r(y1, y2) – расстояние между узлами сетки y1 и y2; p – количество узлов сетки.

Ниже описаны часто используемые функции соседства:

Гауссова функция

mihalrev06.wmf

Bubble-функция:

mihalrev07.wmf

где α(t) – так называемый темп обучения; σ(t) – радиус захвата соседей [5].

Для анализа данных выполним нормализацию по формуле

mihalrev08.wmf

где n – объём данных, xi1, …, xin – набор уникальных значений признака Xi; mihalrev09.wmf – набор уникальных значений признака mihalrev10.wmf; F(xij) – эмпирическая функция распределения признака Xi:

mihalrev11.wmf

где mihalrev12.wmf – есть квантиль уровня F(xij) для нормального распределения

mihalrev13.wmf

Построим карту Кохонена, по очереди отбрасывая неинформативные признаки с точки зрения конверсии (рис. 3).

Самыми информативными оказались следующие признаки: «Имеет проект, заведённый по собственной инициативе» (характерно для группы с высокой конверсией), «Дней между передачами» (низкие значения характерны для группы с низкой конверсией), «Интересовался ли разными транспортными средствами» (не характерно для группы с низкой конверсией), «Пришёл от дилера» (не характерно для группы с высокой конверсией), «Имеет упрощённую систему налогообложения» (весьма характерно для группы с низкой конверсией), «Дней прошло с последней покупки» (высокие значения не характерны для группы с низкой конверсией).

Конкретные диапазоны, соответствующие нормированным значениям, можно вывести обратным преобразованием признаков.

Метод упругих карт может служить обобщением метода главных компонент. Задача построения вложенного многообразия является оптимизационной и состоит в поиске такой нелинейной (упругой) поверхности, дисперсия проекций точек данных на которую будет минимально искажена по сравнению с дисперсией исходных точек данных. Изначально упругая сетка может располагаться в плоскости первых двух главных компонент.

pic_126.tif

Рис. 3. Карта Кохонена: Закрашенная область – кластеры с высокой конверсией (2, 3, 4), обведённая контуром область – кластеры с низкой конверсией (0, 1, 6, 7, 9)

pic_127.wmf

Рис. 4. Статистика по кластерам

pic_128.wmf

Рис. 5. Статистика по группам кластеров

Для метода главных компонент задача формально ставится следующим образом

Старые признаки должны как можно точнее линейно восстанавливаться по новым:

mihalrev14.wmf = 1, …, n, ∀x ∈ X

как можно точнее на обучающей выборке x1, …, xl:

mihalrev15.wmf

где f1(x), …, fn(x) – исходные числовые признаки; g1(x), …, gm(x) – новые числовые признаки, m ≤ n.

Исходная матрица «объекты-признаки»

mihalrev16.wmf

Новая матрица «объекты-признаки»

mihalrev17.wmf

Матрица линейного преобразования признаков:

mihalrev18.wmf

Матричная запись линейного преобразования

mihalrev19.wmf

Матричная запись оптимизируемого функционала

mihalrev20.wmf

Решением задачи метода главных компонент является нахождение матрицы U. Столбцы U – это собственные векторы матрицы FTF, соответствующие максимальным собственным значениям λ1, …, λm [3].

G = FU.

Упругая сетка имеет узлы, нумеруемые индексами yij, i = 1…p, j = 1…q. Каждый узел yij ставится в соответствие подмножеству точек данных Kij (i = 1…p, j = 1…q) так, что этот узел для каждой точки из этого подмножества является ближайшим:

mihalrev21.wmf

Конечное положение упругой сетки достигается оптимизацией линейной комбинации функционалов, отражающих следующий набор свойств:

1. Близость к точкам данных:

mihalrev22.wmf

2. Упругость по отношению к растяжению:

mihalrev23.wmf

3. Упругость по отношению к изгибу:

mihalrev24.wmf

Таким образом:

mihalrev25.wmf

где mihalrev26.wmf – число точек данных; λ, μ – коэффициенты «упругости» сетки.

Построим двумерную упругую карту с параметрами λ = 0,01, μ = 2 и развернём на плоскости (рис. 6).

pic_129.tif

Рис. 6. Упругая карта. Распределение плотности данных. Белым отмечены точки данных, соответствующие успешным коммуникациям

pic_130.tif

Рис. 7. Упругая карта. Дано 6 раскрасок в разрезе информативных признаков: 1 – «Интересовался разными ТС»; 2 – «Прошло дней с последней покупки»; 3 – «Имеет самостоятельно заведённый проект»; 4 – «Имеет упрощённую систему налогообложения; 5 – «Пришёл от дилера»; 6 – «Частота покупок»

Отразим данные на карте в разрезе информативных признаков, аналогично карте Кохонена (рис. 7).

Выполним кластеризацию методом k-means с пятью кластерами (рис. 8) и составим статистику (рис. 9).

pic_131.tif

Рис. 8. Кластеризация после построения упругой карты

pic_132.wmf

Рис. 9. Статистика кластеров после применения упругой карты

Кластером с наиболее высокой конверсией (8,26 %) оказался кластер № 1, содержащий 16,33 % испытаний, для которого характерны признаки: «Скорее интересуется разными ТС», «Имеет недавнюю покупку», «Имеет проект, заведённый по собственной инициативе».

Кластером с наиболее низкой конверсией (0,89 %) оказался кластер № 3, содержащий 39,31 % испытаний, для которого характерны признаки: «Скорее не интересовался разными ТС», «Не имеет недавнюю покупку», «Не имеет проект, заведённый по собственной инициативе», «Имеет низкую частоту покупок»

Заключение

Применение упругих карт позволило сделать лучшую кластеризацию, по сравнению с картами Кохонена: гораздо лучше были классифицированы клиенты с очень низкой конверсией и сравнительно неплохо были классифицированы клиенты с высокой конверсией. Были получены наглядные результаты в виде плотности распределения данных, распределения значимых признаков, а также распределения кластеров. Полученные данные могут быть применены при построении регрессионных решений и планировании маркетинговых коммуникаций.