После того как вы определились с перечнем характеристик и переменных в них, можно приступать к описанию имеющихся на рынке кластеров. Для этого сначала выполняется механический перебор переменных. Таким образом получаются все возможные варианты кластеров. Затем из этого набора убирают те кластеры, которых в реальности не существует.
Например, если вновь вернуться к рис. 3, то путём перебора переменных в характеристиках мы получим 12 кластеров (три переменных в первой характеристике и по две переменных во второй и третьей). Однако, посмотрев на рынок, мы видим, что некоторые из этих кластеров искусственны, т. е. в реальности не существуют. Это кластеры «Низкая цена – На заказ – Прямая закупка», «Низкая цена – На заказ – Тендеры», «Средняя цена – На заказ – Прямая закупка», «Средняя цена – На заказ – Тендеры». Не бывает дешёвой и средней по цене офисной мебели на заказ. Такая мебель предполагает высокую цену. Соответственно, такие искусственные кластеры убираются из модели, в ней остаются лишь те кластеры, которые существуют в действительности. В моём примере таких кластеров шесть (на самом деле их должно быть больше, однако для простоты объяснения я дополнительно удалил ещё два реально существующих кластера: это кластеры «Высокая цена – Серийная – Тендеры» и «Высокая цена – На заказ – Прямая закупка»).
Теперь у нас есть описание реальных кластеров рынка – описание структуры рынка.
Как понять, какое количество характеристик (две или три) будет на вашем рынке? Ответ спрятан в довольно неожиданном месте, в области умственных способностей человечества. Как уже упоминалось ранее, в далёком 1956 г. американский психолог Джордж Миллер доказал, что кратковременная память среднестатистического человека может одновременно эффективно обрабатывать ограниченное количество объектов. Это всего лишь 7 ± 2 объекта (да, кто-то из нас чуть умнее, а кто-то чуть задумчивее)[6]. Как мы видим, это смехотворно малое число. Что бы мы ни думали о мощи собственного интеллекта и о заключениях Миллера, рекомендую прислушаться к выводам этого уважаемого господина, тем более что они признаны современной наукой. Правило Миллера определяет и предельное количество кластеров, которое может быть в вашей модели. В чистом виде их должно быть 7–9. Я допускаю, что их может быть чуть больше, например 10–12. Это если вы уверены в аналитических способностях своего мозга. В любом случае нужно помнить: чем больше кластеров, тем труднее будет нашему мозгу качественно их анализировать и сравнивать между собой. Соответственно, если вы видите, что с учётом переменных количество реальных (а не искусственных!) кластеров переваливает за 10–12, наверное, следует ограничиться двумя характеристиками вместо трёх. Если же три характеристики с учётом их переменных дают приемлемое количество реальных кластеров, значит, оставьте три характеристики.
При этом следует избегать простых решений. Например, «а гори оно огнём – пусть будет только две характеристики», даже если количество кластеров позволяет использовать три. Этот соблазн вас обязательно настигнет, если вам не удастся разыскать третью характеристику. Однако максимальной точности анализ в MVC-1 достигает тогда, когда кластеризация выполнена именно на основе трёх характеристик. Выбор лишь двух, хотя и допустим, тем не менее чреват снижением глубины анализа. Такой выбор разрешается лишь в случаях превышения возможного числа кластеров или тогда, когда мы не можем найти третью характеристику, несмотря на все старания.
ШАГ 3
Определяем список компаний