Pathway: гайд по удалённым исследованиям, глава 4

глава 4

Методы и их применение

В этой главе обзор популярных методов, но, конечно, этот список не исчерпывающий.

Тест первого клика (First Click)

Респондент видит один экран и получает задание, похожее на сценарий взаимодействия с этим интерфейсом в реальной жизни. Задача респондента — найти и нажать на элемент, с которого ему надо начать выполнять нужное действие.

Тест первого клика помогает проверить:

Насколько легко найти элемент на странице

Как респонденты пользуются навигацией, — например, чтобы понять, в каком пункте меню люди ищут нужное действие

Насколько эффективно меню. Например, может ли респондент найти в нем конкретный товар

Что учесть при проведении:

Нельзя формулировать вопрос с использованием названия кнопки или пункта меню.

При сравнении двух экранов таким методом обязательно посчитайте и учтите уровень значимости.

Какие результаты получите:

Карта кликов с возможностью выделить области экрана для сравнения количества нажатий.
Время до клика отразит, насколько просто респонденту было прийти к нужному ответу.
Среднее и медианное время поможет проанализировать результат для всей выборки в целом. При сравнении двух экранов таким методом обязательно посчитайте и учтите уровень значимости.

Тест предпочтения (Preference)

В тесте сравнивают два или больше экрана (изображения, элемента интерфейса, текста). Их показывают каждому респонденту на одном экране и задают вопрос относительно оцениваемого параметра (например: «Какой вариант кажется вам более выгодным?»). Задача респондента — выбрать один из этих вариантов.

Preference-тест помогает оценить:

Какие варианты лучше сработают по оцениваемым критериям

Что учесть при проведении:

Макеты должны различаться всего одной деталью, при этом изменение должно быть заметным. Лучше не сравнивать похожие оттенки или шрифты, тексты уведомлений или кнопок
Мы рекомендуем вводить оцениваемый параметр в вопросе, чтобы респонденты могли сравнивать варианты относительно этого параметра (например, эмоциональность или доверительность)
При анализе результатов важно смотреть на уровень значимости, чтобы убедиться, насколько различимы между собой варианты
За один тест можно менять только одну деталь, иначе не получится понять, почему респонденты предпочли тот или иной вариант
Нельзя сравнивать экраны своего и других сервисов. Между ними может быть слишком много различий, которые не сгладить
Результаты Preference- и A/B-теста могут не совпасть. Хоть эти методы и похожи, первый показывает субъективное впечатление, второй — поведение пользователей в реальности.

Какие результаты получите:

Процент людей по каждому экрану, которые его выбрали.
Развернутые комментарии респондентов, почему они выбрали тот или иной вариант.

Как определить победивший вариант

Для этого нужно оценить погрешности для долей респондентов, которые выбрали каждый из вариантов и представить полученные значения в виде интервалов. Это можно сделать с помощью нашего калькулятора.

Если интервалы пересекаются, то статистически значимая разница не доказана, а если интервалы не пересекаются, то победителем является вариант, выбранный наибольшим количеством респондентов.

Пятисекундный тест

Респондентам показывают экран на 5 или больше секунд, а затем просят описать, что они увидели

Пятисекундный тест помогает проверить:

Какое впечатление сложилось от страницы.

Какие элементы люди сразу замечают и запоминают.

Как респонденты считывают смысл.

Что учесть при проведении:

Не предупреждайте респондентов, что именно им нужно увидеть и запомнить.

Не говорите респондентам, что они будут видеть экран 5 секунд и потом ответят на вопрос, — нужно только ограничить время демонстрации страницы.
5 секунд может быть недостаточно для некоторых материалов. В этом случае лучше увеличить время показа экрана, например до 10 или 20 секунд.
Для сравнения разных версий дизайна лучше использовать Preference-тест.

Какие результаты получите:

Качественные ответы респондентов, которые можно будет разбить на смысловые группы или категории.

Карточная сортировка

Респондентам нужно распределить темы по группам.

Если группы заранее заданы, то это закрытая карточная сортировка, если респондентам нужно самим определить группы и их названия — открытая.

Например, вы хотите структурировать каталог одежды

Дайте респондентам карточки с предметами гардероба и посмотрите:

Как они распределят их по категориям «праздничная одежда», «юбки и брюки», «аксессуары».
Или на какие группы они их делят — так поймете, какие категории они хотят видеть в каталоге.

Карточная сортировка помогает понять, как организовать информационную архитектуру сайта:

Классифицировать каталог

Структурировать меню страницы

Что учесть при проведении:

Тест не поможет проверить текущий каталог или меню — в этом случае лучше проводить исследование по методике Treejack. Карточная сортировка подходит для создания структуры с нуля.

Метод не даст готовую структуру каталога или меню. Результаты нужно проанализировать и выявить принципы, которыми руководствовались респонденты при обозначении групп и распределении предметов по группам.

Какие результаты получите:

Для открытой сортировки — категории каталога или пункты меню, выделенные респондентами.

Для закрытой сортировки — распределение элементов по группам, которое сделали респонденты.

Сценарное тестирование

Сценарное тестирование помогает проверить:

Любые сценарии на существующих продуктах или прототипах

Например, вы собрали экран корзины и вам надо, чтобы пользователь выбрал способ и время доставки. Респондент должен настроить нужные параметры и на экране чекаута убедиться, что он всё выбрал правильно.

Что учесть при проведении:

Следите за сложностью сценария. Чем больше возможных вариантов действий пользователя — тем сложнее может быть интерпретировать результаты
Не всегда можно узнать, почему у пользователя возникли сложности, даже если будете видеть его путь или ответы на дополнительные вопросы.

Какие результаты получите:

Записи сессий пользователей.
Тепловые карты

Метрики взаимодействия со сценарием — например среднее и медианное время сессии, количество пользователей, которые не достигли результата.

Тестирование навигации (Tree Testing)

Респонденту показывают текстовую структуру сайта или приложения (дерево категорий) без визуального оформления. Он получает задание — например: «Найдите, где можно оформить возврат товара» — и проходит по дереву, выбирая нужные разделы. Метод позволяет проверить информационную архитектуру в чистом виде, без влияния дизайна.

Tree Testing помогает проверить:

Понятны ли названия разделов и категорий для пользователей

Логична ли иерархия: ищут ли пользователи нужный раздел там, где он находится

Есть ли проблемные места в навигации, где пользователи теряются или возвращаются назад

Что учесть при проведении:

Формулируйте задания как реалистичные сценарии
Не используйте в тексте задания точные названия пунктов меню — иначе респондент просто найдёт совпадение по словам, а не покажет, как он мыслит
Подготовьте 5–10 заданий разной сложности: от простых (найти раздел на первом уровне) до сложных (найти элемент, вложенный на 3–4 уровня)
Tree Testing хорошо дополняет карточную сортировку: сначала создайте структуру с помощью сортировки, а потом проверьте её Tree Testing'ом.

Какие результаты получите:

Процент успешных ответов — доля респондентов, нашедших правильный раздел.

Прямота навигации — доля респондентов, которые дошли до ответа без возвратов назад. Высокий процент успеха при низкой прямоте означает, что люди находят ответ, но с трудом.

Распространённые пути — какие маршруты по дереву выбирали респонденты чаще всего. Это помогает увидеть, куда пользователи идут интуитивно.

Распределение первых кликов — в какие разделы верхнего уровня респонденты заходили в первую очередь.

Модель Кано (Kano Model)

Метод для приоритизации функций продукта, разработанный профессором Нориаки Кано. Для каждой функции респонденту задают два вопроса: «Как вы отнесётесь, если эта функция будет?» (функциональный) и «Как вы отнесётесь, если этой функции не будет?» (дисфункциональный). На каждый вопрос — пять вариантов ответа от «Мне это нравится» до «Мне это не нравится». Комбинация ответов определяет категорию функции.

Функции распределяются по категориям:

Обязательные (Must-be) — базовые ожидания, без которых продукт неприемлем.

Одномерные (Performance) — чем лучше реализованы, тем выше удовлетворённость.

Привлекательные (Attractive) — приятный бонус, но их отсутствие не расстраивает

Безразличные (Indifferent) — не влияют на удовлетворённость.

Обратные (Reverse) — их наличие вызывает недовольство.

Модель Кано помогает:

Определить, какие функции критически важны, а какие можно отложить

Найти функции, которые могут стать конкурентным преимуществом

Приоритизировать бэклог на основе данных, а не интуиции

Что учесть при проведении:

Формулируйте функции понятным для респондентов языком — избегайте внутренней терминологии и технических деталей
К каждой функции можно добавить изображение или видео, чтобы респонденту было легче понять, о чём идёт речь
Оптимальное количество функций для оценки — 10–15. При большем количестве респонденты устают и качество ответов падает
Включите перемешивание функций, чтобы порядок не влиял на результаты.

Какие результаты получите:

Категория каждой функции — обязательная, одномерная, привлекательная, безразличная или обратная.

Коэффициенты удовлетворённости и неудовлетворённости, которые показывают, насколько сильно функция влияет на восприятие продукта.

Распределение ответов по каждой функции для детального анализа.

Ранжирование (Ranking)

Респондент получает список элементов (функций, концепций, приоритетов) и расставляет их в порядке от наиболее важного к наименее важному. В отличие от шкал оценки, ранжирование заставляет делать выбор — одинаковые оценки невозможны, поэтому результаты показывают реальные приоритеты.

Ранжирование помогает:

Определить относительную важность функций или концепций, когда на шкалах все варианты получают похожие оценки

Понять приоритеты пользователей при распределении ресурсов

Выявить, какие элементы пользователи ставят на первое место, а какие считают наименее значимыми

Что учесть при проведении:

Ограничьте список 3–7 элементами. При большем количестве когнитивная нагрузка возрастает и качество данных снижается — респонденты начинают расставлять элементы в конце списка случайным образом.
Включите перемешивание вариантов, чтобы порядок по умолчанию не влиял на результаты
Используйте ранжирование, когда важен именно относительный порядок, а не абсолютные оценки. Если нужно измерить силу предпочтения, лучше подойдёт MaxDiff
Формулируйте элементы коротко и однозначно, чтобы респондент мог быстро сравнить их между собой.

Какие результаты получите:

Средний ранг каждого элемента — чем ниже значение, тем выше приоритет
Распределение голосов по позициям — таблица, показывающая, сколько респондентов поставили каждый элемент на каждую позицию
Частота попадания на первое место — как часто элемент оказывался самым важным.

MaxDiff (Maximum Difference Scaling)

Метод для измерения относительных предпочтений из длинного списка элементов. Респондент видит подмножество из 3–5 элементов и выбирает лучший и худший. Это повторяется несколько раундов — элементы ротируются так, чтобы каждый встретился одинаковое число раз. В отличие от простого ранжирования, MaxDiff работает с большими списками (10–30+ элементов) и даёт более точные результаты.

Например, вы хотите понять, какие из 30 функций приложения наиболее важны для пользователей. Простое ранжирование 30 элементов слишком сложно, а на шкалах все функции получат высокие оценки. MaxDiff решает эту проблему: респондент каждый раз сравнивает только 4 элемента и делает простой выбор — лучший и худший.

MaxDiff помогает:

Приоритизировать длинный список функций, сообщений или концепций

Получить чёткую иерархию предпочтений без проблемы «всё одинаково важно»

Измерить силу предпочтения — насколько один элемент важнее другого

Что учесть при проведении:

Оптимальное количество элементов в одном наборе — 4–5. Меньше трёх — слишком мало информации за раунд, больше пяти — сложно сравнивать
Общее количество элементов может быть от 6 до 30+. Система автоматически рассчитает количество раундов.
Формулируйте элементы на одном уровне абстракции: не смешивайте конкретные функции с абстрактными концепциями.
Можно настроить подписи для лучшего и худшего варианта — например, «Самое важное» и «Наименее важное» или «Больше всего нравится» и «Меньше всего нравится».

Какие результаты получите:

Оценка каждого элемента по шкале от 0 до 100, где 100 — элемент всегда выбирался лучшим, 50 — нейтральная позиция, 0 — всегда выбирался худшим
Визуализация в виде горизонтальной диаграммы с чётким ранжированием всех элементов
Результаты являются шкальными: если элемент набрал 60, а другой 30, первый действительно вдвое предпочтительнее.

Дизайн-опросы (Design Surveys)

Универсальный метод, в котором респондентам показывают дизайн-артефакты (макеты, иконки, изображения, баннеры, видео) и задают вопросы с помощью различных типов блоков: шкал, вопросов с выбором ответа, открытых вопросов. Это позволяет собрать количественную и качественную обратную связь о дизайне на масштабной выборке — когда модерируемое тестирование невозможно или избыточно.

Какие типы вопросов можно комбинировать:

Шкалы (числовая, эмодзи, звёзды) — для количественной оценки: «Насколько понятен этот экран?», «Оцените привлекательность дизайна»

Вопросы с выбором ответа (один или несколько) — для категоризации: «Какое слово лучше всего описывает этот дизайн?», «Какие элементы вы заметили первыми?»

Открытые вопросы — для качественной обратной связи: «Что бы вы изменили в этом макете?», «Какие эмоции вызывает этот дизайн?».Матричные вопросы — для оценки по нескольким критериям: «Оцените каждый вариант по параметрам: современность, доверительность, простота».

Дизайн-опросы помогают узнать:

Какое первое впечатление производит дизайн

Понятны ли элементы интерфейса и считывается ли заложенный смысл

Какие эмоции и ассоциации вызывает визуальное решение

Как пользователи оценивают конкретные дизайн-элементы: логотипы, иконки, цветовые схемы, компоновку

Что учесть при проведении:

Показывайте визуальный стимул чётко и крупно — к каждому вопросу можно прикрепить изображение или видео, которое респондент увидит рядом или над вопросом
Сочетайте количественные и качественные вопросы: шкала покажет общую оценку, а открытый вопрос — почему респондент оценил именно так
Для сравнения вариантов используйте одинаковые вопросы для каждого варианта, чтобы результаты можно было сопоставить.

Какие результаты получите:

Количественные оценки по шкалам — средние значения, распределение ответов, возможность статистического сравнения вариантов
Распределение ответов по вариантам выбора — какие характеристики респонденты выделяют чаще всего.
Качественная обратная связь из открытых вопросов — темы и паттерны, которые помогут понять мотивацию за оценками.
Кросс-табуляция из матричных вопросов — как респонденты оценивают дизайн по нескольким параметрам одновременно.

0. интро

1. О немодерируемых исследованиях

2. подготовка к исследованию

3. анализ результатов

4. подробнее о методах

сценарное тестирование