Анализ клиентских сред

Материал из MachineLearning.

(Различия между версиями)
Перейти к: навигация, поиск
(Новая: {{TOCright}} '''Клиентская среда''' — это совокупность ''клиентов'' (пользователей, cубъектов), регулярно польз...)
Строка 1: Строка 1:
{{TOCright}}
{{TOCright}}
-
'''Клиентская среда''' — это совокупность ''клиентов'' (пользователей, cубъектов), регулярно пользующихся фиксированным набором ''сервисов'' (услуг, ресурсов, товаров, предметов, объектов), при условии, что действия клиентов протоколируются в электронном виде.
+
'''Клиентская среда''' — это совокупность ''клиентов'' (пользователей, cубъектов), регулярно пользующихся фиксированным набором ''сервисов'' (товаров, ресурсов, предметов, объектов).
-
Примерами ''действий'' клиентов являются:
+
Предполагается, что действия клиентов протоколируются в электронном виде.
-
использование сервиса,
+
Примерами ''действий'' являются:
-
оценивание (рейтингование) сервиса,
+
использование сервиса или покупка товара,
 +
оценивание (рейтингование) сервиса или товара,
обращение за информацией,
обращение за информацией,
оплата услуг,
оплата услуг,
выбор тарифного плана,
выбор тарифного плана,
участие в маркетинговой акции,
участие в маркетинговой акции,
 +
получение бонуса от компании,
отказ от обслуживания, {{S|и т.д.}}
отказ от обслуживания, {{S|и т.д.}}
-
'''Анализ клиентских сред''', АКС (customer environment analysis, CEA) — это технология [[интеллектуальный анализ данных|интеллектуального анализа данных]], позволяющая выделить из протокола действий клиентов полезную информацию для [[маркетинг]]а и [[управление взаимоотношениями с клиентами|управления взаимоотношениями с клиентами]] (customer relationship management, CRM).
+
'''Анализ клиентских сред''', АКС (customer environment analysis, CEA) — это технология обработки протоколов действий клиентов, позволяющая эффективно вычислять взаимно согласованные оценки сходства клиентов и сервисов, и использовать их для решения таких бизнес-задач, как автоматизация маркетинга, персонализация и улучшение качества сервисов, повышение удовлетворённости и лояльности клиентов, более эффективное привлечение и удержание клиентов.
-
Конечной целью АКС является повышение удовлетворённости и лояльности клиентов, улучшение качества сервисов, более эффективное привлечение и удержание клиентов.
+
-
Термин ''Анализ клиентских сред'' введён {{S|[[Рудаков, Константин Владимирович|К. В. Рудаковым]]}}, компания [[Форексис]].
+
Концепция ''клиентской среды'' введена {{S|[[Рудаков, Константин Владимирович|К. В. Рудаковым]]}} в конце 90-х и положена в основу технологии ''анализа клиентских сред'', развиваемой компанией [[Форексис]].
 +
 
 +
Технология АКС может быть использована для построения
 +
[[Рекомендующая система|рекомендующих систем]] (recommender system),
 +
[[Персонализация|персонализации предложений]] (targeting, direct marketing), и
 +
[[Управление взаимоотношениями с клиентами|управления взаимоотношениями с клиентами]] (customer relationship management, CRM).
 +
 
 +
Наиболее близким к АКС направлением является [[коллаборативная фильтрация]] (collaborative filtering).
 +
Основное отличие в том, что АКС нацелен на получение взаимно согласованных оценок сходства клиентов и сервисов.
 +
Второе отличие в том, что в АКС рассматривается весь комплекс задач и методов, связанных с дальнейшим использованием полученных оценок сходства для визуализации, кластеризации, классификации и прогнозирования поведения клиентов.
== Примеры клиентских сред ==
== Примеры клиентских сред ==
Клиентские среды возникают в самых разных сферах бизнеса, и не только бизнеса.
Клиентские среды возникают в самых разных сферах бизнеса, и не только бизнеса.
-
Можно говорить о клиентских средах производителей товаров, дилерских сетей, сетей супермаркетов, операторов связи, эмитентов пластиковых карт, библиотек, интернет-магазинов, сайтов, {{S|и т. д.}}
+
Можно говорить о клиентских средах производителей товаров, дилерских сетей, сетей супермаркетов, операторов связи, эмитентов пластиковых карт, библиотек, интернет-магазинов, поисковых машин, социальных сетей, форумов, блогов {{S|и т. д.}}
-
== Задачи анализа клиентских сред ==
+
== Основные принципы АКС ==
-
 
+
-
Задача ''предсказания рейтингов'' решается в интернет-магазинах, особенно книжных, и сетях видеопроката.
+
-
Приобретая через сайт некоторый товар (книгу, фильм, {{S|и т. д.}}),
+
-
клиент имеет возможность выразить своё отношение к нему,
+
-
выставив рейтинг, обычно целое число {{S|от 1 до 5}} или {{S|от 1 до 10}}.
+
-
Система использует информацию о всех выставленных рейтингах для ''персонализации'' предложения.
+
-
Когда клиент видит на сайте страницу с описанием товара,
+
-
ему показывается также список всех схожих товаров, получивших высокий рейтинг у схожих клиентов.
+
-
Основная задача — быстро находить в огромном объёме данных множества схожих клиентов и схожих товаров,
+
-
затем прогнозировать их рейтинги для данного клиента.
+
-
 
+
-
== Технология анализа клиентских сред ==
+
 +
=== Взаимосогласованные оценки сходства клиентов и сервисов ===
Технология АКС основана на вычислении количественных оценок сходства между сервисами и между клиентами.
Технология АКС основана на вычислении количественных оценок сходства между сервисами и между клиентами.
-
{{S|В простейших}} случаях сходство сервисов оценивается по принципу «сервисы схожи, если ими пользуются одни и те же клиенты; чем больше общих клиентов, тем более схожи сервисы».
+
{{S|В простейших}} случаях сходство сервисов оценивается по принципу
-
Подобная идея применяется давно и успешно.
+
«сервисы схожи, если ими пользуются одни и те же клиенты; чем больше общих клиентов, тем более схожи сервисы».
-
Известно, например, что более 95% пользователей amazon.com не упускают возможности узнать, «какие ещё книги покупают клиенты, купившие эту книгу».
+
Известно, например, что более 95% пользователей [http://www.amazon.com Amazon.com]] не упускают возможности узнать,
-
Однако данный принцип сходства имеет ограниченную сферу применимости, так как он выдвигает чрезмерно жёсткое требование, чтобы схожие сервисы имели одних и тех же общих клиентов, тогда как вполне достаточно, чтобы они имели схожих клиентов. Например, сайты двух конкурирующих производителей видеотехники могут не иметь общих клиентов, тем не менее, они схожи как по тематике, так и по целевой аудитории.
+
«какие ещё книги покупают клиенты, купившие эту книгу».
 +
Однако данный принцип сходства имеет ограниченную сферу применимости, так как он выдвигает чрезмерно жёсткое требование, чтобы схожие сервисы имели одних и тех же ''общих клиентов'', тогда как вполне достаточно, чтобы они имели ''схожих клиентов''. Например, сайты двух конкурирующих производителей видеотехники могут иметь очень мало общих клиентов, тем не менее, они схожи как по тематике, так и по целевой аудитории.
-
Более интересные результаты даёт усовершенствованный принцип сходства: «сервисы схожи, если ими пользуются схожие (но не обязательно одни и те же) клиенты; в свою очередь, клиенты схожи, если они пользуются схожими (но не обязательно одинаковыми) сервисами». Этот принцип сложнее для реализации, так как две меры сходства оказываются зависимыми друг от друга. Эффективная реализация этой идеи возможна путём выявления ''скрытых профилей''.
+
Более адекватные результаты даёт усовершенствованный принцип сходства:
 +
«сервисы схожи, если ими пользуются схожие (но не обязательно одни и те же) клиенты; в свою очередь,
 +
клиенты схожи, если они пользуются схожими (но не обязательно одинаковыми) сервисами».
 +
Этот принцип сложнее с точки зрения анализа данных, так как две меры сходства оказываются зависимыми друг от друга. Эффективная реализация этой идеи возможна путём выявления ''скрытых профилей''.
-
Действия клиента являются проявлением его предпочтений, вкусов, привычек — того, что можно назвать его ''скрытым профилем''. Профиль не доступен в явном виде и лишь косвенно проявляется в поведении клиента.
+
=== Восстановление скрытых профилей клиентов и сервисов ===
-
Существует и открытая часть пользовательского профиля, которая обычно включает:
+
Действия клиента являются проявлением его предпочтений, вкусов, привычек (taste).
-
* социально-демографические характеристики, собираемые через анкету, возможно, лишь для части клиентов;
+
Предполагается, что существует ''скрытый профиль'' клиента — вектор, координаты которого соответствуют всевозможным предпочтениям; значение координаты есть относительная важность данного предпочтения для данного клиента.
-
* описательные статистики, характеризующие среднюю активность клиента.
+
Профиль не доступен в явном виде и лишь косвенно проявляется в поведении клиента.
-
Каждый сервис также имеет свой скрытый профиль — это набор пользовательских предпочтений, вкусов, привычек, которые он способен удовлетворить. Как правило, сервисы изначально упорядочены в виде иерархического каталога, отражающего структуру пользовательских предпочтений, однако эта каталогизация может быть неполной и неточной.
+
Иногда бывает доступна небольшая часть пользовательского профиля в виде социально-демографических характеристик, собираемых через анкету.
-
Открытая часть профиля сервиса обычно включает:
+
Анкета содержит такие атрибуты, как возраст, пол, город, образование, семейное положение, профессию, достаток, сферы интересов, {{S|и т.п.}}
-
* позиции данного сервиса в тематическом каталоге;
+
Качество анкетных данных, как правило, невысоко: они неточны, субъективны, содержат много пропусков и собираются лишь по части клиентов.
-
* атрибуты, присвоенные данному сервису либо экспертами, либо в результате некоторой автоматической обработки описаний предметов;
+
 
-
* описательные статистики, характеризующие средний спрос на данный сервис.
+
С другой стороны, каждый сервис также имеет свой ''скрытый профиль'' — это набор предпочтений, которые он способен удовлетворить.
 +
{{S|В некоторых}} случаях и здесь можно рассчитывать на наличие дополнительных данных.
 +
Во-первых, это каталоги сервисов, которые для удобства представляются в виде иерархии разделов или тем.
 +
Эта иерархия отражает структуру пользовательских предпочтений и образует тематическую часть профиля.
 +
Во-вторых, иногда бывают доступны некоторые атрибуты сервисов.
 +
Например, если речь идёт о товарах, то это производитель, стоимость, потребительские качества, {{S|и т.д.}}
 +
Эти данные вводятся либо экспертами, либо в путём автоматической обработки текстовых описаний товаров.
 +
Данные о сервисах также могут быть неточными, субъективными и неполными.
В результате огромного количества отдельных выборов сервисы и клиенты перенимают атрибуты друг друга.
В результате огромного количества отдельных выборов сервисы и клиенты перенимают атрибуты друг друга.
-
Например, атрибут «возраст» на первый взгляд принадлежит исключительно пользователям.
+
Например, атрибут «возраст» на первый взгляд принадлежит исключительно клиентам.
-
Однако сервисы, часто выбираемые клиентами от 16 до 24 лет, также приобретают этот атрибут и характеризуются как «молодёжные».
+
Однако сервисы, часто выбираемые клиентами от 15 до 25 лет, также приобретают этот атрибут и характеризуются как «молодёжные».
-
{{S|С другой}} стороны, атрибут «рок-музыка», первоначально характеризующий положение предметов в каталоге, переносится на тех клиентов, которые часто выбирают сервисы (в данном примере — музыкальные диски) с таким атрибутом.
+
{{S|С другой}} стороны, атрибут «классическая музыка», первоначально характеризующий положение музыкальных дисков в тематическом каталоге, переносится на тех пользователей, которые часто выбирают такие диски.
 +
 
 +
Объединение атрибутов клиентов и сервисов в единый ''унифицированный профиль'' даёт ряд важных преимуществ:
 +
* появляется возможность интерпретировать любой сервис или группу сревисов, а также любого клиента или группу клиентов в терминах, понятных маркетологам;
 +
* можно сравнивать не только клиентов с клиентами и сервисы с сервисами, но и клиентов с сервисами;
 +
* можно проводить сравнение по «частичному» профилю; например, сравнивать клиентов относительно заданного сервиса (группы сервисов) или сравнивать сервисы относительно заданного клиента (группы клиентов);
 +
* можно отказаться от хранения огромных объёмов сырых исходных данных и строить масштабируемые решения, выбирая размер хранимых профилей; в частности, тематический каталог может быть усечён на любом уровне иерархии;
 +
* обновление профилей не требует громоздких вычислений и может происходить в режиме реального времени;
 +
* достаточно лишь небольшого объёма данных о клиенте, чтобы восстановить его профиль; это достигается благодаря привлечению информации не только о данном клиенте, но и о схожих с ним клиентах;
 +
* профиль сервиса может быть построен априори, на основе его рубрикации или атрибутов, присвоенных экспертами; это снимает проблему «холодного старта» (‘cold start’ problem), когда новый сервис не предлагается из-за того, что он ещё никем не был выбран, и никем не выбирается из-за того, что ещё он никому не предлагался.
 +
 
 +
=== Итерационное согласование профилей клиентов и сервисов ===
 +
''Унифицированные скрытые профили'' клиентов и сервисов выявляются (восстанавливаются) по исходным протоколам действий клиентов.
 +
При этом доступные части профилей некоторых клиентов и некоторых сервисов играют роль начального приближения.
 +
Качество этой информации может быть довольно низким, что не столь важно, поскольку в дальнейшем она корректируется объективными данными, содержащимися в протоколах.
 +
Существенно то, что эта информация задаёт структуру унифицированного профиля и предопределяет интерпретацию его компонент.
-
Таким образом, для описания профилей клиентов и сервисов может быть использована одна и та же информационная структура — ''унифицированный скрытый профиль''.
 
-
Скрытые профили клиентов и сервисов выявляются по исходным протоколам действий клиентов.
 
-
Открытые части профилей играют роль начального приближения.
 
Знание скрытых профилей сервисов позволяет вычислить скрытые профили клиентов;
Знание скрытых профилей сервисов позволяет вычислить скрытые профили клиентов;
и, наоборот, знание скрытых профилей клиентов позволяет вычислить скрытые профили сервисов.
и, наоборот, знание скрытых профилей клиентов позволяет вычислить скрытые профили сервисов.
-
На этом принципе и основаны методы взаимного согласования скрытых профилей.
+
{{S|На этом}} принципе и основаны итерационные методы восстановления взаимно согласованных скрытых профилей.
 +
 
 +
=== Применение профилей и оценок сходства для решения бизнес-задач ===
 +
 
 +
== Задачи анализа клиентских сред ==
 +
 
 +
* Построение профилей клиентов, выявление и интерпретация типов поведения клиентов
 +
* Сегментация клиентской базы
 +
* Выявление целевых групп клиентов
 +
* Структуризация и каталогизация сервисов в соответствии с объективными предпочтениями клиентов
 +
* Персонализация предложения клиентам (direct marketing)
 +
* Построение карт сходства клиентов и сервисов
 +
* Предсказание оттока клиентов (churn prediction)
 +
* Выявление необычного или потенциально опасного поведения клиентов (fraud detection)
 +
 
 +
<!--
 +
Задача ''предсказания рейтингов'' решается в интернет-магазинах, особенно книжных, и сетях видеопроката.
 +
Приобретая через сайт некоторый товар (книгу, фильм, {{S|и т. д.}}),
 +
клиент имеет возможность выразить своё отношение к нему,
 +
выставив рейтинг, обычно целое число {{S|от 1 до 5}} или {{S|от 1 до 10}}.
 +
Система использует информацию о всех выставленных рейтингах для [[персонализация|персонализации]] предложения.
 +
Когда клиент видит на сайте страницу с описанием товара,
 +
ему показывается также список всех схожих товаров, получивших высокий рейтинг у схожих клиентов.
 +
Основная задача — быстро находить в огромном объёме данных множества схожих клиентов и схожих товаров,
 +
затем прогнозировать их рейтинги для данного клиента.
 +
-->
 +
== Компоненты технологии АКС ==
== Литература ==
== Литература ==

Версия 22:35, 10 мая 2008

Содержание

Клиентская среда — это совокупность клиентов (пользователей, cубъектов), регулярно пользующихся фиксированным набором сервисов (товаров, ресурсов, предметов, объектов). Предполагается, что действия клиентов протоколируются в электронном виде. Примерами действий являются: использование сервиса или покупка товара, оценивание (рейтингование) сервиса или товара, обращение за информацией, оплата услуг, выбор тарифного плана, участие в маркетинговой акции, получение бонуса от компании, отказ от обслуживания, и т.д.

Анализ клиентских сред, АКС (customer environment analysis, CEA) — это технология обработки протоколов действий клиентов, позволяющая эффективно вычислять взаимно согласованные оценки сходства клиентов и сервисов, и использовать их для решения таких бизнес-задач, как автоматизация маркетинга, персонализация и улучшение качества сервисов, повышение удовлетворённости и лояльности клиентов, более эффективное привлечение и удержание клиентов.

Концепция клиентской среды введена К. В. Рудаковым в конце 90-х и положена в основу технологии анализа клиентских сред, развиваемой компанией Форексис.

Технология АКС может быть использована для построения рекомендующих систем (recommender system), персонализации предложений (targeting, direct marketing), и управления взаимоотношениями с клиентами (customer relationship management, CRM).

Наиболее близким к АКС направлением является коллаборативная фильтрация (collaborative filtering). Основное отличие в том, что АКС нацелен на получение взаимно согласованных оценок сходства клиентов и сервисов. Второе отличие в том, что в АКС рассматривается весь комплекс задач и методов, связанных с дальнейшим использованием полученных оценок сходства для визуализации, кластеризации, классификации и прогнозирования поведения клиентов.

Примеры клиентских сред

Клиентские среды возникают в самых разных сферах бизнеса, и не только бизнеса. Можно говорить о клиентских средах производителей товаров, дилерских сетей, сетей супермаркетов, операторов связи, эмитентов пластиковых карт, библиотек, интернет-магазинов, поисковых машин, социальных сетей, форумов, блогов и т. д.

Основные принципы АКС

Взаимосогласованные оценки сходства клиентов и сервисов

Технология АКС основана на вычислении количественных оценок сходства между сервисами и между клиентами. В простейших случаях сходство сервисов оценивается по принципу «сервисы схожи, если ими пользуются одни и те же клиенты; чем больше общих клиентов, тем более схожи сервисы». Известно, например, что более 95% пользователей Amazon.com] не упускают возможности узнать, «какие ещё книги покупают клиенты, купившие эту книгу». Однако данный принцип сходства имеет ограниченную сферу применимости, так как он выдвигает чрезмерно жёсткое требование, чтобы схожие сервисы имели одних и тех же общих клиентов, тогда как вполне достаточно, чтобы они имели схожих клиентов. Например, сайты двух конкурирующих производителей видеотехники могут иметь очень мало общих клиентов, тем не менее, они схожи как по тематике, так и по целевой аудитории.

Более адекватные результаты даёт усовершенствованный принцип сходства: «сервисы схожи, если ими пользуются схожие (но не обязательно одни и те же) клиенты; в свою очередь, клиенты схожи, если они пользуются схожими (но не обязательно одинаковыми) сервисами». Этот принцип сложнее с точки зрения анализа данных, так как две меры сходства оказываются зависимыми друг от друга. Эффективная реализация этой идеи возможна путём выявления скрытых профилей.

Восстановление скрытых профилей клиентов и сервисов

Действия клиента являются проявлением его предпочтений, вкусов, привычек (taste). Предполагается, что существует скрытый профиль клиента — вектор, координаты которого соответствуют всевозможным предпочтениям; значение координаты есть относительная важность данного предпочтения для данного клиента. Профиль не доступен в явном виде и лишь косвенно проявляется в поведении клиента.

Иногда бывает доступна небольшая часть пользовательского профиля в виде социально-демографических характеристик, собираемых через анкету. Анкета содержит такие атрибуты, как возраст, пол, город, образование, семейное положение, профессию, достаток, сферы интересов, и т.п. Качество анкетных данных, как правило, невысоко: они неточны, субъективны, содержат много пропусков и собираются лишь по части клиентов.

С другой стороны, каждый сервис также имеет свой скрытый профиль — это набор предпочтений, которые он способен удовлетворить. В некоторых случаях и здесь можно рассчитывать на наличие дополнительных данных. Во-первых, это каталоги сервисов, которые для удобства представляются в виде иерархии разделов или тем. Эта иерархия отражает структуру пользовательских предпочтений и образует тематическую часть профиля. Во-вторых, иногда бывают доступны некоторые атрибуты сервисов. Например, если речь идёт о товарах, то это производитель, стоимость, потребительские качества, и т.д. Эти данные вводятся либо экспертами, либо в путём автоматической обработки текстовых описаний товаров. Данные о сервисах также могут быть неточными, субъективными и неполными.

В результате огромного количества отдельных выборов сервисы и клиенты перенимают атрибуты друг друга. Например, атрибут «возраст» на первый взгляд принадлежит исключительно клиентам. Однако сервисы, часто выбираемые клиентами от 15 до 25 лет, также приобретают этот атрибут и характеризуются как «молодёжные». С другой стороны, атрибут «классическая музыка», первоначально характеризующий положение музыкальных дисков в тематическом каталоге, переносится на тех пользователей, которые часто выбирают такие диски.

Объединение атрибутов клиентов и сервисов в единый унифицированный профиль даёт ряд важных преимуществ:

  • появляется возможность интерпретировать любой сервис или группу сревисов, а также любого клиента или группу клиентов в терминах, понятных маркетологам;
  • можно сравнивать не только клиентов с клиентами и сервисы с сервисами, но и клиентов с сервисами;
  • можно проводить сравнение по «частичному» профилю; например, сравнивать клиентов относительно заданного сервиса (группы сервисов) или сравнивать сервисы относительно заданного клиента (группы клиентов);
  • можно отказаться от хранения огромных объёмов сырых исходных данных и строить масштабируемые решения, выбирая размер хранимых профилей; в частности, тематический каталог может быть усечён на любом уровне иерархии;
  • обновление профилей не требует громоздких вычислений и может происходить в режиме реального времени;
  • достаточно лишь небольшого объёма данных о клиенте, чтобы восстановить его профиль; это достигается благодаря привлечению информации не только о данном клиенте, но и о схожих с ним клиентах;
  • профиль сервиса может быть построен априори, на основе его рубрикации или атрибутов, присвоенных экспертами; это снимает проблему «холодного старта» (‘cold start’ problem), когда новый сервис не предлагается из-за того, что он ещё никем не был выбран, и никем не выбирается из-за того, что ещё он никому не предлагался.

Итерационное согласование профилей клиентов и сервисов

Унифицированные скрытые профили клиентов и сервисов выявляются (восстанавливаются) по исходным протоколам действий клиентов. При этом доступные части профилей некоторых клиентов и некоторых сервисов играют роль начального приближения. Качество этой информации может быть довольно низким, что не столь важно, поскольку в дальнейшем она корректируется объективными данными, содержащимися в протоколах. Существенно то, что эта информация задаёт структуру унифицированного профиля и предопределяет интерпретацию его компонент.

Знание скрытых профилей сервисов позволяет вычислить скрытые профили клиентов; и, наоборот, знание скрытых профилей клиентов позволяет вычислить скрытые профили сервисов. На этом принципе и основаны итерационные методы восстановления взаимно согласованных скрытых профилей.

Применение профилей и оценок сходства для решения бизнес-задач

Задачи анализа клиентских сред

  • Построение профилей клиентов, выявление и интерпретация типов поведения клиентов
  • Сегментация клиентской базы
  • Выявление целевых групп клиентов
  • Структуризация и каталогизация сервисов в соответствии с объективными предпочтениями клиентов
  • Персонализация предложения клиентам (direct marketing)
  • Построение карт сходства клиентов и сервисов
  • Предсказание оттока клиентов (churn prediction)
  • Выявление необычного или потенциально опасного поведения клиентов (fraud detection)


Компоненты технологии АКС

Литература

Ссылки

Личные инструменты