Когда клиенты приходят к нам с задачей «сравнить всё со всем» — от характеристик продукта до ценностей бренда — они часто выбирают MaxDiff как наиболее точный инструмент приоритизации. Эта статья будет полезна исследователям, маркетологам, продакт-менеджерам и UX-специалистам, которые планируют использовать MaxDiff для принятия управленческих решений и хотят избежать типичных методологических ловушек.
Вопрос «Сколько утверждений можно включить?» звучит технически, но на практике он напрямую влияет на достоверность результатов. Слишком короткий список — и вы рискуете упустить значимые драйверы выбора. Слишком длинный — и получаете усталость респондентов, случайные ответы и «шумную» модель. MaxDiff чувствителен к качеству дизайна: при перегрузке анкеты даже математически корректная модель начинает отражать не реальные предпочтения, а когнитивные ограничения участников опроса.
За последние годы в Тестографе я консультировал десятки проектов с использованием MaxDiff: от оценки УТП в B2B до тестирования продуктовых гипотез в FMCG и IT. Самая распространённая ошибка — попытка включить в один MaxDiff весь длинный список идей «на всякий случай». Вторая по частоте — недооценка влияния длины анкеты на поведение респондентов. В результате клиенты получают красивые таблицы и индексы, но сомневаются, можно ли на них опираться.
В этой статье я разберу, где проходит граница между «достаточно» и «слишком много», и как принимать решение о количестве утверждений так, чтобы сохранить и статистическую устойчивость модели, и реальное качество данных.
Когда список утверждений в MaxDiff начинает расти, меняется не только длина анкеты — меняется поведение респондента. И это принципиальный момент, который часто недооценивают.
1. Когнитивная нагрузка
Каждое задание MaxDiff требует от человека одновременно:
При 10–15 утверждениях нагрузка распределяется комфортно. Но если их становится 30–40, число выборочных задач увеличивается, и респондент начинает «экономить усилия». В этот момент в игру вступают когнитивные сокращения:
MaxDiff предполагает осознанный сравнительный выбор. Когда когнитивный ресурс истощается, метод начинает работать хуже.
2. Усталость и падение внимательности
В проектах на платформе Тестограф я регулярно вижу один и тот же паттерн:
если MaxDiff-блок занимает более 4–6 минут, растёт:
Это особенно заметно в B2C-исследованиях с широкой аудиторией. В B2B-сегменте респонденты более мотивированы, но и там при перегрузке качество начинает снижаться.
3. Поведенческие сигналы деградации данных
Вот признаки того, что утверждений слишком много:
С точки зрения модели это выглядит как «все примерно одинаково важны». На практике это почти всегда означает усталость или перегрузку.
4. Иллюзия полноты
Самая частая логика клиента звучит так:
Но MaxDiff — это не способ собрать все идеи в одном месте. Это инструмент выявления относительных приоритетов. Если список слишком большой, сравнение становится размытым. В итоге мы получаем менее точную и менее интерпретируемую иерархию.
Поэтому ключевой вопрос — не «сколько можно технически включить», а «при каком объёме сохраняется осмысленный выбор».
В следующем разделе разберём методологические ограничения MaxDiff и как число утверждений связано с дизайном эксперимента.
Когда мы обсуждаем допустимое количество утверждений, важно понимать: ограничения задаёт не только психология респондента, но и сама логика экспериментального дизайна.
MaxDiff строится на принципе сбалансированного неполного блочного дизайна (BIBD) или его алгоритмических аналогов. Это означает, что каждое утверждение должно быть показано достаточное число раз и в разных комбинациях с другими утверждениями. Только в этом случае модель сможет корректно оценить относительные utility-показатели.
Если список увеличивается, автоматически растёт:
Эти параметры взаимосвязаны. Нельзя просто добавить ещё 15 утверждений, не изменив структуру исследования.
Сколько показов нужно одному утверждению
На практике мы ориентируемся на то, чтобы каждое утверждение было показано минимум 3–4 раза одному респонденту. При 12–15 утверждениях это достигается относительно легко. При 30 и более утверждениях число задач начинает расти экспоненциально.
Если не увеличивать количество задач, модель становится менее устойчивой. Если увеличивать — анкета удлиняется, и мы возвращаемся к проблеме усталости.
Связь с длиной анкеты
MaxDiff редко является единственным блоком в исследовании. Обычно ему предшествуют скрининговые вопросы, блоки профиля, иногда — оценочные шкалы.
В реальных проектах я рекомендую ориентироваться на 8–12 MaxDiff-задач на одного респондента. При стандартном размере набора (4 утверждения в задаче) это комфортный диапазон по времени прохождения. Если для корректного покрытия списка требуется 18–20 задач, стоит задуматься, не перегружен ли дизайн.
Компромисс между широтой и точностью
Чем больше утверждений, тем ниже точность оценки каждого из них при фиксированном бюджете. Это фундаментальный компромисс. Можно либо:
В консультациях я часто предлагаю клиентам простой тест: если вы мысленно уберёте 20% списка, сильно ли изменится управленческое решение? Если нет — список, скорее всего, перегружен.
В следующем разделе перейдём к практическим диапазонам и разберём, сколько утверждений безопасно использовать в разных сценариях.
За годы работы с MaxDiff-проектами я пришёл к выводу, что универсального числа не существует. Однако есть диапазоны, внутри которых риск потери качества данных существенно ниже.
До 15 утверждений — комфортный диапазон
Это оптимальный формат для большинства задач: приоритизация характеристик продукта, тестирование коммуникационных сообщений, оценка факторов выбора.
При таком объёме удаётся обеспечить достаточное количество показов каждого утверждения без чрезмерного увеличения числа задач. Респонденты сохраняют концентрацию, а модель демонстрирует стабильные utility-оценки даже при средней выборке.
Если исследование включает дополнительные блоки вопросов, этот диапазон остаётся безопасным.
15–25 утверждений — допустимо при аккуратном дизайне
Этот формат часто используется, когда клиент хочет охватить более широкий перечень гипотез. Методологически это возможно, но требует внимания к нескольким моментам:
При хорошем дизайне данные остаются качественными, но запас устойчивости уже меньше. Ошибки формулировок и перегруженность анкеты начинают сильнее влиять на результат.
25–40 утверждений — зона повышенного риска
Здесь я всегда рекомендую сначала задать вопрос: действительно ли все пункты равнозначны с точки зрения задачи?
В этом диапазоне почти неизбежно растёт либо продолжительность блока, либо требования к размеру выборки. Без увеличения бюджета точность оценок падает. Кроме того, респонденты начинают использовать упрощённые стратегии выбора, что отражается на распределении utility.
Такой объём оправдан в B2B-исследованиях с мотивированной аудиторией или в стратегических проектах с большим бюджетом и последующей сложной сегментацией.
Более 40 утверждений — только при специальной архитектуре исследования
Технически это возможно, но почти всегда требует усложнённого дизайна: разделения на несколько волн, предварительного отбора через скрининговый этап или использования адаптивных моделей.
В массовых исследованиях такой объём почти всегда приводит к деградации качества данных.
Если сформулировать общий ориентир: в 80% практических задач оптимальный диапазон — 12–20 утверждений. Всё, что выходит за эти рамки, требует отдельного обоснования и расчёта.
В следующем разделе разберём алгоритм принятия решения: как определить «своё» оптимальное количество, исходя из целей и бюджета исследования.
Когда клиент задаёт вопрос «Сколько утверждений можно включить?», я не называю число сразу. Сначала мы уточняем несколько параметров исследования. Именно они определяют допустимый объём.
1. Цель исследования
Если задача — определить 3–5 приоритетов для коммуникации, избыточный список не нужен. В этом случае лучше сфокусироваться на наиболее релевантных гипотезах и обеспечить точность модели.
Если планируется глубокая сегментация, построение кластеров или дальнейшее моделирование спроса, можно рассматривать более широкий перечень, но при увеличенной выборке.
2. Однородность списка
Чем более однородны утверждения по уровню абстракции, тем устойчивее работает MaxDiff.
Проблемы начинаются, когда в одном списке смешиваются:
В таких случаях респонденту сложнее делать сопоставимый выбор, а модель начинает отражать разницу уровней, а не реальных приоритетов. Иногда разумнее разделить список на два отдельных блока.
3. Размер выборки и бюджет
Количество утверждений нельзя рассматривать отдельно от объёма выборки. Если бюджет ограничен, увеличение списка автоматически снижает стабильность оценок.
В проектах, где требуется более 25 утверждений, я почти всегда рекомендую либо увеличить выборку, либо предварительно сократить список через экспертный этап или короткое скрининговое исследование.
4. Планируется ли сегментационный анализ
Если результаты будут анализироваться по нескольким сегментам, фактический размер подвыборок уменьшается. Это означает, что при большом списке модель внутри сегмента может стать нестабильной.
В такой ситуации разумнее уменьшить число утверждений, но сохранить аналитическую глубину.
5. Пилотирование
Даже при корректных расчётах всегда полезен пилот. Небольшой тест позволяет увидеть:
Иногда именно пилот показывает, что список перегружен, хотя теоретически всё выглядело допустимо.
В следующем разделе я разберу типичные ошибки при работе с длинными списками и объясню, почему попытка «оценить всё сразу» почти всегда приводит к компромиссу в качестве данных.
Когда список выходит за пределы комфортного диапазона, проблемы чаще всего возникают не из-за самого метода, а из-за управленческих решений на этапе подготовки.
Первая типичная ошибка — попытка включить в один MaxDiff всё, что обсуждалось внутри команды. В списке оказываются стратегические гипотезы, операционные детали, формулировки разной степени конкретности. В результате исследование превращается в инструмент «внутреннего согласования», а не проверки приоритетов у аудитории.
Вторая ошибка — отсутствие предварительной фильтрации. Часто можно сократить список на 20–30% без потери управленческой ценности. Для этого достаточно экспертной сессии или короткого предварительного опроса с простой оценочной шкалой. Если этого не сделать, MaxDiff используется как этап грубой сортировки, хотя он предназначен для точной приоритизации.
Третья ошибка — игнорирование тестового запуска. Даже при корректных расчётах длина блока может оказаться чрезмерной для конкретной аудитории. Это особенно заметно в массовых B2C-исследованиях. Пилот помогает увидеть реальные поведенческие сигналы, а не полагаться на теоретическую модель.
Ещё одна проблема — стремление сохранить фиксированный бюджет при увеличении числа утверждений. В такой конфигурации снижается устойчивость коэффициентов, а различия между пунктами становятся статистически менее надёжными. Внешне результаты выглядят аккуратно, но интерпретация становится рискованной.
За годы работы я убедился: если список ощущается перегруженным уже на этапе подготовки, это почти всегда сигнал к его сокращению или структурированию, а не к усложнению дизайна.
В заключении подведём итог и сформулируем практический ориентир, на который можно опираться в большинстве проектов.
Вопрос о количестве утверждений в MaxDiff не имеет универсального ответа. Ограничения задаются не только техническими возможностями метода, но и когнитивной нагрузкой на респондента, размером выборки и целями анализа.
В большинстве прикладных задач безопасный диапазон находится в пределах 12–20 утверждений. Он позволяет сохранить баланс между широтой охвата и устойчивостью модели. Расширение списка до 25 и более пунктов возможно, но требует обоснования: увеличения выборки, аккуратного дизайна и обязательного пилотирования.
Главный ориентир — не максимальный охват, а интерпретируемость результатов. Если модель даёт чёткую иерархию приоритетов, хорошо различимые сегменты и устойчивые коэффициенты, значит, объём выбран правильно. Если различия сглажены, а профили выглядят «плоскими», проблема чаще всего в перегруженном списке.
В своей практике я исхожу из простого принципа: MaxDiff должен помогать принимать решения, а не создавать иллюзию глубины анализа. Чем яснее сформулирована задача и чем строже отобран список утверждений, тем надёжнее итоговые выводы.
Именно поэтому при проектировании MaxDiff важнее дисциплина отбора, чем количество включённых пунктов.