Как рассчитать репрезентативность выборки

socioline.ru

Расчет доверительного интервала
(«погрешность», ± % )

Если размер генеральной совокупности более 1 000 000 или сложно оценить точно иначе чем фразой «ну очень много» — можно просто оставить поле пустым.

Пояснения

Доверительная вероятность показывает, с какой вероятностью случайный ответ попадет в доверительный интервал. Для простоты можно понимать её как точность выборки. Как правило, используется 95%, но в условиях малых бюджетов и для небольших выборок, когда высокая точность не нужна, вероятностью можно пожертвовать и понизить её уровень до 90% и даже до 85% (главное не забыть учесть это в процессе анализа и в выводах). И наоборот, чем большую выборку может себе позволить исследователь, тем выше можно установить точность полученных данных.

Доверительный интервал можно понимать как погрешность, задает размах части кривой распределения по обе стороны от выбранной точки, куда могут попадать ответы.

Необходимы пояснения для тех, кто в первый раз сталкивается с понятиями доверительной вероятности и доверительного интервала. Например, выборка в 384 человека для генеральной совокупности более 500 000 человек (например, один из административных округов Москвы) означают доверительную вероятность 95% и доверительный интервал ±5%. То есть при проведении 100 исследований с такой выборкой (384 человека) в 95 процентов случаев получаемые ответы по законам статистики будут находиться в пределах ±5% от исходного.

Если еще упростить то, опросив 384 человка из полумиллиона и получив искомое значение «Х», можно утверждать, что 95% человек или 475 000 ответов попадут в интервал Х±5%, оставшиеся 25 000 ответов попадут «пальцем в небо», то есть за пределы полученного интервала.

Применяемые Формулы

Формулы расчета размера выборки, применяемые в калькуляторе.

Размер Выборки

где:

Z = Z фактор (например 1,96 для 95% доверительного интервала)
p = процент интересующих респондентов или ответов,
в десятичной форме (0,5 по умолчанию)
c = доверительный интервал, в десятичной форме
(например, 0,04 = ±4%)

Корректировка для малой генеральной совокупности

ss = размер выборки
css = скорректированная выборка
pop = генеральная совокупность

Источник

Репрезентативная выборка в контексте: определяем эффективность кампании на этапе тестирования

Как рассчитать выборку и получить значимые результаты

Перед запуском рекламной кампании принято проводить A/B-тестирование. Однако не всякий тест может считаться показательным. И первая ошибка – неверно определена репрезентативная выборка. Следствие такой ошибки – впустую потраченные деньги на запуск неэффективной рекламы.

Что такое репрезентативная выборка и как ее правильно посчитать, рассказываем ниже.

Что такое репрезентативная выборка

С понятиями «генеральная совокупность» и «репрезентативная выборка» сталкиваются все, кто запускают A/B-тесты и хотят получить статистически значимые результаты. Ведь чаще всего провальные тесты случаются по двум причинам: маленькая выборка и недостаточный объем данных.

Для расчета репрезентативной выборки сейчас совсем не нужно знать сложные формулы и рассчитывать их вручную. Для этого есть удобные онлайн-калькуляторы (Optimizely, Mindbox, VWO) и методика SurveyMonkey.

Для работы со всеми перечисленными инструментами надо знать правила проведения тестов, оперировать основными понятиями и понимать, как работают инструменты расчета репрезентативной выборки.

Вот основные понятия, которые нужно знать для расчета выборки:

Каждый их перечисленных онлайн-калькуляторов имеет свою специфику. Об этом мы расскажем ниже.

Выборка в тестах: зачем считать и что еще влияет на результаты

Перед запуском рекламной кампании принято запускать тестирование. Это позволяет определить наиболее эффективный вариант объявления. В объявлении может тестироваться любой элемент: заголовки, креативы, описания, расширения, CTA-кнопки и т. д.

Тестирование разных вариантов объявлений может проводиться для повышения кликабельности объявления, увеличения коэффициента конверсии. Однако, по данным AppSumo, значимые результаты дают только 1 из 8 тестов.

Правильное определение репрезентативной выборки для тестовых групп обеспечивает достоверные результаты по тестам. Ниже рассмотрим причины, по которым тест может не дать значимых результатов.

1. Недостаточно данных

Допустим, мы запустили тестирование двух вариантов объявлений с разными заголовками. Вечером получаем такие результаты:

Как рассчитать репрезентативность выборки. Смотреть фото Как рассчитать репрезентативность выборки. Смотреть картинку Как рассчитать репрезентативность выборки. Картинка про Как рассчитать репрезентативность выборки. Фото Как рассчитать репрезентативность выборки

По результатам первого дня может показаться, что текущее объявление работает более эффективно.

В этом случае у рекламодателя возникают такие вопросы:

Нельзя делать выводы об эффективности кампании по нескольким десяткам переходов и паре кликов. Для принятия решения необходимо собрать достаточное количество аналитических данных.

Для определения размера нашей выборки воспользуемся онлайн-калькулятором Optimizely.

Проводим такие действия:

Расчеты показывают, что для получения статистически значимых данных выборка для тестируемой группы должна состоять из 1300 человек.

Как рассчитать репрезентативность выборки. Смотреть фото Как рассчитать репрезентативность выборки. Смотреть картинку Как рассчитать репрезентативность выборки. Картинка про Как рассчитать репрезентативность выборки. Фото Как рассчитать репрезентативность выборки

2. Неправильно поставлена гипотеза

Это еще одна распространенная причина получения непоказательных результатов тестирования.

Например, в ходе теста была выдвинута гипотеза, что новое описание в объявлении принесет больше трафика на целевую страницу и мы получим более высокую конверсию. Но в результате тестирования трех вариантов описания не было обнаружено значительной разницы.

В таких ситуациях возникает вопрос о том, как сделать тест показательным и улучшить результаты. Один из способов — заинтересовать целевую аудиторию. Для этого может быть недостаточно просто изменить описание в объявлении или заголовок. Нужны более значимые изменения. Можно поменять креатив или изменить торговое предложение (увеличить скидку, изменить цену, предложить покупателям рассрочку).

3. Выбрана не та метрика

Для получения значимых результатов важно выбрать только один показатель, который надо улучшить. Например, цель – повысить коэффициент конверсии к покупке для новых посетителей. Именно с учетом этого показателя и рассчитывают выборку большинство онлайн-калькуляторов.

Однако если данных по конверсиям недостаточно, то нужно ориентироваться на другие метрики. Например, на рост CTR. В таких случаях расчет выборки можно провести с помощью онлайн-калькулятора Mindbox.

С помощью Mindbox можно определить размер выборки для 2–5 вариантов тестирования по таким показателям:

Размер выборки напрямую зависит от выбранного тестируемого показателя и количества тестируемых вариантов.

Например, посмотрим, какой размер выборки понадобится нам при тестировании показателя Open Rate. При таких условиях: средний Open Rate – 15%, ожидаемый прирост показателя – 30%.

Как рассчитать репрезентативность выборки. Смотреть фото Как рассчитать репрезентативность выборки. Смотреть картинку Как рассчитать репрезентативность выборки. Картинка про Как рассчитать репрезентативность выборки. Фото Как рассчитать репрезентативность выборки

Получается, размер выборки для каждого варианта объявления составляет 2 224 человека.

А вот скольким людям надо показать объявление при тестировании показателя конверсия в заказы при средней конверсии по истории 5%:

Как рассчитать репрезентативность выборки. Смотреть фото Как рассчитать репрезентативность выборки. Смотреть картинку Как рассчитать репрезентативность выборки. Картинка про Как рассчитать репрезентативность выборки. Фото Как рассчитать репрезентативность выборки

Размер выборки для каждой тестируемой группы составляет 29 827 человек.

Вывод: чем ближе к деньгам, тем более показательны результаты. Поэтому все A/B-тесты измерялись бы по Conversion Rate. Но проблема в том, что чем ниже по этой воронке продаж, тем больше людей потребуется для проведения теста. Для расширения охвата и получения достоверных данных в этом случае надо ориентироваться на повышение показателя Click Rate или Open Rate.

Как определить размер выборки

Метод SurveyMonkey

Компания SurveyMonkey предложила метод определения репрезентативной выборки с учетом предела погрешности и уровня доверия.

Сделать это можно с помощью такой таблицы:

Как рассчитать репрезентативность выборки. Смотреть фото Как рассчитать репрезентативность выборки. Смотреть картинку Как рассчитать репрезентативность выборки. Картинка про Как рассчитать репрезентативность выборки. Фото Как рассчитать репрезентативность выборки

Методика расчета репрезентативной выборки состоит из пяти этапов. Показываем, как это сделать на примере интернет-магазина электроинструментов.

Исходные данные: магазин находится в Курске и хочет запустить рекламу для привлечения новых клиентов на сайт.

Перед запуском кампания проводит A/B-тест и тестирует два объявления с разными вариантами заголовков. Выдвигается гипотеза, что второй вариант объявления понравится целевой аудитории больше и по нему будет больше кликов и конверсий.

1 этап – определяем генеральную совокупность. Интернет-магазин собрал достаточно данных о покупателях. И знает, что их целевая аудитория – это мужчины в возрасте от 25 до 70 лет, которые живут в Курске и интересуются ремонтом, строительством, обустройством дома.

Для оценки приблизительного размера целевой аудитории воспользуемся myTarget. Эта платформа предоставляет гибкие настройки таргетинга и позволяет приблизительно определить рекламный охват, который мы и примем как генеральную совокупность.

В примере мы не будем запускать кампанию через myTarget, а просто используем его для определения размера ЦА. Подробнее о том, как запустить рекламу в системе, читайте в пошаговом гайде «Как настроить рекламу в myTarget».

Заходим в профиль myTarget. Выбираем цель – «Конверсии» – «Трафик», ниже указываем URL. Слева появится прогноз аудитории за 7 дней. По мере настройки таргетинга рекламный охват будет сокращаться.

Как рассчитать репрезентативность выборки. Смотреть фото Как рассчитать репрезентативность выборки. Смотреть картинку Как рассчитать репрезентативность выборки. Картинка про Как рассчитать репрезентативность выборки. Фото Как рассчитать репрезентативность выборки

Сократим рекламный охват. Для этого указываем такие настройки:

Уже после этих настроек размер аудитории сократится до 43 000 – 144 000 человек:

Как рассчитать репрезентативность выборки. Смотреть фото Как рассчитать репрезентативность выборки. Смотреть картинку Как рассчитать репрезентативность выборки. Картинка про Как рассчитать репрезентативность выборки. Фото Как рассчитать репрезентативность выборки

Указываем интересы. Потенциальные покупатели интересуются автомобилями, ремонтными и строительными работами, благоустройством дома:

Как рассчитать репрезентативность выборки. Смотреть фото Как рассчитать репрезентативность выборки. Смотреть картинку Как рассчитать репрезентативность выборки. Картинка про Как рассчитать репрезентативность выборки. Фото Как рассчитать репрезентативность выборки

Таким образом размер нашей целевой аудитории находится в пределах 34 000 – 108 000 человек.

2. Определяем точность теста. Для получения статистически значимых результатов рекомендуется устанавливать предел погрешности в районе 1–5%, а уровень доверия – 95–99%.

Например, мы поставили гипотезу, что пользователи чаще будут кликать по второму объявлению. Уровень погрешности принимаем 1%, значит, уровень доверия составляет 99%. Это означает, что фактически 98–100% пользователям второй вариант объявления понравится больше, чем первый.

3. Определяем размер выборки с помощью таблицы. Приблизительно наша генеральная совокупность составляет 100 000 человек. Подходящая нам выборка составляет – от 383 до 8763 человек. Для получения максимально значимых данных устанавливаем уровень доверия на уровне 99%. Поэтому остановимся на 660.

Как рассчитать репрезентативность выборки. Смотреть фото Как рассчитать репрезентативность выборки. Смотреть картинку Как рассчитать репрезентативность выборки. Картинка про Как рассчитать репрезентативность выборки. Фото Как рассчитать репрезентативность выборки

4. Прикидываем ожидаемую конверсию по объявлению. Средний показатель по предыдущим кампаниям составлял 12%. Поэтому принимаем CR = 12%.

5. Узнаем, скольким людям надо показать наши объявления, чтобы получить статистически значимые результаты:

То есть выборка для одного тестовой группы составляет 5500 человек. Мы тестируем два варианта объявления. Поэтому и второе объявление (при распределении аудитории 50/50) должно увидеть 5500 пользователей.

Optimizely

Сравним, насколько размер выборки, полученный методом SurveyMonkey, будет отличаться от результатов онлайн-калькуляторов.

Заходим в онлайн-калькулятор и задаем там такие значения:

Вводим все эти значения и получаем, что контрольная группа должна состоять из 5300 человек.

Как рассчитать репрезентативность выборки. Смотреть фото Как рассчитать репрезентативность выборки. Смотреть картинку Как рассчитать репрезентативность выборки. Картинка про Как рассчитать репрезентативность выборки. Фото Как рассчитать репрезентативность выборки

В результате мы получили почти такие же числа, как и методом SurveyMonkey. Только во втором расчете контрольная группа должна состоять из 5300 человек, а не 5500 человек.

Mindbox

Посмотрим, какой размер тестируемой выборки для нашего примера получится с помощью калькулятора Mindbox.

Вносим свои показатели в калькулятор:

Как рассчитать репрезентативность выборки. Смотреть фото Как рассчитать репрезентативность выборки. Смотреть картинку Как рассчитать репрезентативность выборки. Картинка про Как рассчитать репрезентативность выборки. Фото Как рассчитать репрезентативность выборки

По результатам Mindbox размер выборки для каждой тестируемой группы должен составлять 6 166 человек. Это больше, чем мы получили по методу SurveyMonkey (5500 человек в контрольной группе) или с помощью калькулятора Optimezely (5300 человек). Однако цифры вполне сопоставимы.

По настройке Mindbox отличается от Optimezely следующими моментами:

Таким образом, на примере мы показали как тремя способами посчитать размер репрезентативной выборки для тестовых кампаний.

Основные сложности в тестах при расчете выборки

Недостаточное количество просмотров

Зачастую для получения статистически значимых результатов размер выборки должен составлять от 2000–3000 человек. И это большая проблема в том случае, если за неделю было всего несколько сотен переходов.

Один из вариантов сократить размер выборки – понизить уровень доверия в настройках онлайн-калькулятора до приемлемых величин (не ниже 80%). А если репрезентативная выборка определяется калькулятором Mindbox, то можно уменьшить еще и показатель мощности. В этом случае данные будут менее достоверными, но все еще не утратят своей статистической значимости.

Например, в Mindbox задаем уровень доверия 99% и мощность 98%. В результате размер выборки для одной тестируемой группы составляет 5 030 человек:

Как рассчитать репрезентативность выборки. Смотреть фото Как рассчитать репрезентативность выборки. Смотреть картинку Как рассчитать репрезентативность выборки. Картинка про Как рассчитать репрезентативность выборки. Фото Как рассчитать репрезентативность выборки

Понижаем уровень достоверности до 85%, а мощность до 80%. Остальные данные оставляем без изменений.

Как рассчитать репрезентативность выборки. Смотреть фото Как рассчитать репрезентативность выборки. Смотреть картинку Как рассчитать репрезентативность выборки. Картинка про Как рассчитать репрезентативность выборки. Фото Как рассчитать репрезентативность выборки

В результате требуемый размер выборки уменьшился почти в 5 раз. Это очень ощутимое сокращения с учетом низкого трафика по рекламе.

Узкая тематика

Основная проблема узкой тематики заключается в том, что всего несколькими десятками ключевых фраз можно описать все запросы, по которым пользователи ищут услугу. Отсюда и низкий трафик.

Решить проблему можно так:

Например, при средней конверсии по истории 3% размер выборки составит 18 273 человека:

Как рассчитать репрезентативность выборки. Смотреть фото Как рассчитать репрезентативность выборки. Смотреть картинку Как рассчитать репрезентативность выборки. Картинка про Как рассчитать репрезентативность выборки. Фото Как рассчитать репрезентативность выборки

Оставляем тот же уровень достоверности и мощности. В показателях выбираем Click Rate. Устанавливаем средний по истории показатель и ожидаемый абсолютный прирост:

Как рассчитать репрезентативность выборки. Смотреть фото Как рассчитать репрезентативность выборки. Смотреть картинку Как рассчитать репрезентативность выборки. Картинка про Как рассчитать репрезентативность выборки. Фото Как рассчитать репрезентативность выборки

Получаем, что выборка для одной тестируемой группы составляет 2213 человек. Это все равно очень много для узкой тематики. Поэтому понижаем достоверность и мощность:

Как рассчитать репрезентативность выборки. Смотреть фото Как рассчитать репрезентативность выборки. Смотреть картинку Как рассчитать репрезентативность выборки. Картинка про Как рассчитать репрезентативность выборки. Фото Как рассчитать репрезентативность выборки

Таким образом, изменение тестируемой метрики и уменьшение показателей достоверности позволило нам сократить размер выборки с 18 273 до 1200 человек.

Рекламироваться в узкой тематике сложно, но есть способы, позволяющие увеличить трафик по объявлениям. Подробнее об этом читайте в нашей статье «Реклама в узкой тематике: 9 советов по повышению эффективности».

Низкий бюджет

В условиях ограниченного бюджета у рекламодателя нет возможности тестировать каждый заголовок, креатив или текст объявления.

Вот советы, которые помогут сэкономить бюджет:

1. Сравнивайте разные объявления. На поступательное тестирование сначала заголовков, потом текстов объявлений, креативов и других элементов потребуется время и немалые бюджеты. Поэтому в условиях ограниченных средств лучше кардинально менять заголовки, тесты, креативы и сравнивать радикально разные варианты объявлений;

2. Используйте системы автоматизации. Если стоит цель сэкономить, то можно создать тестовые объявления самостоятельно, а не платить деньги специалистам. Это позволит высвободить дополнительный ресурс на тестирование большей выборки. Быстро составить объявления можно с помощью систем автоматизации.

Например, для составления объявлений по ключевым словам можно воспользоваться инструментом медиапланирования Click.ru. Он собирает семантику исходя из контента вашего сайта, слов конкурентов или данных счетчиков статистики. А потом на основании отобранных слов составляет объявления:

Как рассчитать репрезентативность выборки. Смотреть фото Как рассчитать репрезентативность выборки. Смотреть картинку Как рассчитать репрезентативность выборки. Картинка про Как рассчитать репрезентативность выборки. Фото Как рассчитать репрезентативность выборки

Вам остается только отредактировать их и запустить тестовые кампании.

Еще один вариант – использовать генератор объявлений из YML. Этот инструмент подходит интернет-магазинам, которые используют выгрузку товаров/услуг в XML.

Как рассчитать репрезентативность выборки. Смотреть фото Как рассчитать репрезентативность выборки. Смотреть картинку Как рассчитать репрезентативность выборки. Картинка про Как рассчитать репрезентативность выборки. Фото Как рассчитать репрезентативность выборки

Высокий бюджет

При высоком бюджете открываются дополнительные возможности: можно тестировать отдельно разные элементы объявления, запускать больше тестов, настраивать не две, а три и более тестовых групп – в этом случае размер выборки увеличивается.

Вот какой размер выборки может быть при двух тестовых группах:

Как рассчитать репрезентативность выборки. Смотреть фото Как рассчитать репрезентативность выборки. Смотреть картинку Как рассчитать репрезентативность выборки. Картинка про Как рассчитать репрезентативность выборки. Фото Как рассчитать репрезентативность выборки

А вот размер выборки при тестировании трех групп (при этом остальные настройки остаются неизменными же):

Как рассчитать репрезентативность выборки. Смотреть фото Как рассчитать репрезентативность выборки. Смотреть картинку Как рассчитать репрезентативность выборки. Картинка про Как рассчитать репрезентативность выборки. Фото Как рассчитать репрезентативность выборки

Но при высоком бюджете важно помнить об эффективности мероприятий. Нельзя допускать того, чтобы затраты превосходили ожидаемый эффект от тестирования. Дополнительные средства можно перенаправить на SEO или другие каналы привлечения клиентов.

Советы по расчету выборки

Вот несколько рекомендаций, которые помогут правильно рассчитать репрезентативную выборку и получить показательное тестирование.

Источник

Простыми словами о выборке

Как рассчитать репрезентативность выборки. Смотреть фото Как рассчитать репрезентативность выборки. Смотреть картинку Как рассчитать репрезентативность выборки. Картинка про Как рассчитать репрезентативность выборки. Фото Как рассчитать репрезентативность выборки

Привет. Я UX-исследователь в СКБ Контур. Чаще всего в работе я использую качественные методы исследований — глубинные интервью и модерируемые юзабилити-тестирования. Количественные исследования без подготовленной инфраструктуры со стороны разработки более ресурсозатратные, поэтому самостоятельно их провести сложнее.

Но самое сложное для меня в проведении количественного исследования — это выборка. Мне ближе гуманитарная сторона исследовательской работы, поэтому разобраться в выборке сложнее, чем в техниках ведения интервью. Если у тебя такая же проблема, эта статья будет полезна.

Ниже я попробовала просто рассказать о выборке, репрезентативности и методах отбора при проведении количественного исследования.

Как рассчитать репрезентативность выборки. Смотреть фото Как рассчитать репрезентативность выборки. Смотреть картинку Как рассчитать репрезентативность выборки. Картинка про Как рассчитать репрезентативность выборки. Фото Как рассчитать репрезентативность выборки

Выборка и репрезентативность

Опрос — это количественный метод, направленный на получение точной, объективной и статистически значимой информации. Если качественные методы помогают в формулировке гипотез, то количественные — масштабируют и проверяют эти гипотезы на всей целевой аудитории.

Поэтому важно проводить отбор респондентов таким образом, чтобы выборочная совокупность отражала состав всей генеральной совокупности.

В социологии есть термин — единица наблюдения. Это может быть один человек, группа или сообщество в зависимости от целей исследования.

Генеральная совокупность — это вся совокупность единиц наблюдения, имеющих отношение к теме исследования.

Например, если ты проводишь продуктовое исследование, то скорее всего твоя генеральная совокупность — это все пользователи сервиса или определенный сегмент.

Выборочная совокупность — часть генеральной совокупности, которую вы изучаете в ходе исследования с помощью разработанных вами инструментов (анкета, гайд и прочее).

Например, в ходе исследования было опрошено 400 респондентов среди всех пользователей сервиса. Это твоя выборочная совокупность.

Выборка должна быть репрезентативной, иначе результаты количественного исследования будут сомнительными.

Репрезентативность — обеспечение в выборочной совокупности наличия всех видов единиц генеральной совокупности в достаточном количестве.

Репрезентативность имеет качественное и количественное выражение. Качественная репрезентация обязывает включить в выборку все возможные варианты респондентов, особенно, если какой-то признак влияет на опыт использования сервиса.

Например, выборка не будет репрезентативной если ты опросишь только новых пользователей (если это не оправдано целями исследования). Особенно это исказит результаты исследования, если длительность использования напрямую влияет на проверку гипотезы.

Как рассчитать репрезентативность выборки. Смотреть фото Как рассчитать репрезентативность выборки. Смотреть картинку Как рассчитать репрезентативность выборки. Картинка про Как рассчитать репрезентативность выборки. Фото Как рассчитать репрезентативность выборки

На практике, особенно в онлайн-опросах, качественная репрезентативность может страдать. Ею можно пренебречь, если вы уверены, что на проверку гипотезы не повлияет принадлежность респондента к той или иной группе. Онлайн-опросы предполагают стихийную выборку и поэтому предусмотреть присутствие всех типов респондентов сложно. Про стихийную выборку подробнее я расскажу ниже.

Чтобы соблюсти количественную репрезентацию нужно обеспечить достаточное число респондентов, в том числе по каждой группе внутри выборки.

Например, если ты пригласишь на опрос 80% новых пользователей и лишь 20% пользователей с опытом — это тоже исказит результаты (опять же если это не предусмотрено дизайном исследования).

И, конечно, для того, чтобы масштабировать результаты опроса на всю генеральную совокупность (в нашем примере — на всех пользователей), нужно в целом рассчитать количество человек, которое ты планируешь пригласить для прохождения опроса.

Что значит «достаточное» количество человек для выборки.

К примеру, если проводить исследование на выборке в 50–100 человек, то погрешность в репрезентативности полученной информации будет выше, чем при опросе 800–1000 человек.

Но увеличивать до бесконечности число опрашиваемых нет смысла. После определенного количества респондентов ошибка выборки остановится на одном уровне.

Ошибка выборки — разность между характеристиками выборочной и генеральной совокупности. Это отклонение средних характеристик выборочной совокупности от средних характеристик генеральной совокупности.

Где-то после 400 респондентов ошибка выборки не меняется. Поэтому обычно в опросах выборочная совокупность составляет 300–400 человек. При таком значении ты можешь уверенно переносить результаты исследования на всю аудиторию при соблюдении качественной репрезентации и корректно составленной анкеты.

Если генеральная совокупность небольшая, то и выборочная совокупность будет меньше стандартных 300–400 респондентов.

Если хочешь разобраться с формулой расчета выборки подробнее про нее можно узнать здесь.

Также ты можешь провести сплошной опрос. При сплошном опросе ты опрашиваешь всю генеральную совокупность.

Например, если есть интересный и немногочисленный сегмент пользователей (30–100 человек), ты можешь опросить их всех. Или это стартап и уже есть первые пользователи. В таком случае тоже можно провести опрос по всей генеральной совокупности.

На практике требованиями количественной репрезентации иногда пренебрегают в силу нехватки ресурсов на обзвон (если это телефонный опрос) или времени на сбор ответов. Или если опрос проводят для сбора гипотез, а не для принятия конечного решения.

Здесь важно понимать, какое решение должно быть принято на основе исследования. Если это важный продуктовый или бизнес-вопрос, то лучше потратить время и деньги на проверку гипотезы с репрезентативной выборкой, чтобы не получить неверные выводы. А если, это, к примеру, опрос для сбора отклика по новой фиче, то можно остановиться на 30–60 респондентах. Основные выводы ты сделаешь, а пользователи по мере работы в сервисе расскажут о том, что ты мог пропустить.

Методы отбора

В количественном исследовании по сравнению с качественным не важно кто перед тобой, потому что все выводы строятся по совокупности ответов респондентов и материал собирается в обезличенном виде. Поэтому в идеале в выборку респонденты должны попадать случайным образом, чтобы сделать результаты максимально свободными от искажений.

Чтобы этого достичь можно использовать один из методов формирования выборки.

Случайные выборки

Они предполагают, что в выборке каждый элемент генеральной совокупности имеет заранее заданную вероятность быть отобранным в исследование.

Простая случайная выборка. Сначала нужно присвоить каждому потенциальному респонденту идентификационный номер. Дальше с помощью генератора случайных чисел определить номера, которые будут включены в выборку для опроса.

Механическая выборка. Как и в простой выборке пользователям присваивается порядковый номер. Только отбор происходит не с помощью генератора случайных чисел, а с шагом равным n. Например, каждый сотый.

Стратифицированная выборка. Для такой выборки нужно поделить генеральную совокупность на сегменты или страты. После чего респонденты внутри каждой группы отбираются случайным образом. Из каждого сегмента выделяют пользователей пропорционально их доле в генеральной совокупности.

Кластерный отбор или гнездовая выборка. Группа потенциальных респондентов отбирается случайным образом из всей генеральной совокупности. Далее внутри этой группы опрашиваются все пользователи. Например, можно опросить всех пользователей, которые зарегистрировались в сервисе в прошлом квартале.

При таком отборе риск искажений выше и важно учитывать внешние и внутренние факторы. Может быть в прошлом квартале в жизни пользователей произошло что-то важное, что повлияло на их желание воспользоваться сервисом. Тогда эта группа будет сильно отличаться от генеральной совокупности.

Неслучайные выборки

Обычно такие методы отбора применяют, если нет возможности или ресурсов для формирования случайной выборки. Например, у тебя мало времени на опрос или нет данных о генеральной совокупности или респонденты труднодоступны.

Квотная выборка. Такой метод можно применять, если у вас есть знания о составе генеральной совокупности. Например, вы знаете, как ваши пользователи распределяются в разрезе по должности, отрасли компании, возрасту и так далее. Тогда можно пропорционально этим долям сформировать выборку: в каждом разрезе выбрать такое число респондентов, которое будет отображать статистику по всей аудитории.

Стихийная выборка. Это метод без особых правил. В опрос попадают все, кто захочет пройти опрос. Такая выборка типична для онлайн-опросов, размещенных в свободном доступе.

«Снежный ком». Тоже достаточно популярная и простая методика. Каждого респондента просят порекомендовать нового среди его друзей, коллег и знакомых, которые подходили бы под параметры исследования. Такая выборка часто применяется когда самостоятельно найти интересующих респондентов затруднительно. Например, пользователи, занимающие высокую должность или с высоким доходом.

«Типичный представитель». Из генеральной совокупности отбираются респонденты с типичными признаками целевой аудитории. Только определить, что взять за такой признак, обычно сложно.

Отдельно стоит сказать про многоступенчатые выборки. На практике чаще всего (иногда интуитивно) исследователи используют как раз многоступенчатый метод. Такой отбор предполагает наличие двух или более этапов формирования выборки. Проще говоря, это микс нескольких методов отбора.

Например, ты собрал статистику по своей аудитории и знаешь, что большинство пользователей находятся в Москве. Это будет первая ступень отбора по «типичному представителю». Далее среди пользователей-москвичей ты приглашаешь на опрос каждого сотого (механическая выборка).

Проводя количественное исследование, не забывай о репрезентативности и продумывай подходящий метод отбора респондентов. Хорошая подготовка — половина успеха.

Источник

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *