Ключевые факты
- Категория
- Математика, даты и финансы
- Типы входных данных
- select, number
- Тип результата
- json
- Покрытие примерами
- 4
- API доступен
- Yes
Обзор
Калькулятор статистической мощности — это специализированный инструмент для оценки вероятности того, что статистический тест обнаружит реальный эффект. Он поддерживает одновыборочные тесты для средних значений и долей, позволяя исследователям и аналитикам быстро рассчитать мощность (power) и размер эффекта на основе размера выборки, уровня значимости (альфа) и ожидаемых показателей. Инструмент помогает избежать проведения исследований с недостаточным объемом данных и обосновать статистическую надежность выводов.
Когда использовать
- •При планировании эксперимента или A/B-теста для оценки того, достаточно ли собранных данных для обнаружения статистически значимых изменений.
- •Для ретроспективного анализа результатов исследования, чтобы понять, не был ли тест недостаточно мощным из-за малого размера выборки.
- •При подготовке научных статей или аналитических отчетов, где требуется строгое обоснование выбранного размера выборки и надежности результатов.
Как это работает
- •Выберите тип статистического теста: проверка разницы средних значений (mean) или разницы долей (proportion), а также укажите тип альтернативной гипотезы.
- •Задайте базовые параметры: уровень значимости (обычно 0.05) и доступный размер выборки.
- •Введите ожидаемые показатели: нулевое и альтернативное среднее со стандартным отклонением, либо нулевую и альтернативную долю.
- •Инструмент мгновенно рассчитает статистическую мощность в долях и процентах, а также определит размер эффекта.
Сценарии использования
Примеры
1. Оценка мощности для теста среднего чека
Продуктовый аналитик- Контекст
- Команда внедрила новую систему рекомендаций и хочет проверить, увеличился ли средний чек пользователей.
- Проблема
- Нужно узнать, какова вероятность обнаружить рост среднего чека со 100 до 105 рублей при выборке в 64 пользователя и стандартном отклонении 15.
- Как использовать
- Выберите тип теста «Разница средних», двустороннюю гипотезу, введите размер выборки 64, нулевое среднее 100, альтернативное 105 и отклонение 15.
- Пример конфигурации
-
{ "testType": "mean", "alternative": "two-sided", "alpha": 0.05, "sampleSize": 64, "nullMean": 100, "alternativeMean": 105, "standardDeviation": 15 } - Результат
- Калькулятор покажет мощность около 76% и размер эффекта 0.33. Это сигнализирует аналитику о том, что выборку желательно немного увеличить для достижения стандарта в 80%.
2. Расчет мощности для A/B-теста конверсии
Маркетолог- Контекст
- Запускается новая email-рассылка. Текущая конверсия в клик составляет 50%, ожидается рост до 60%.
- Проблема
- Необходимо оценить мощность теста при доступной базе в 100 подписчиков для проверки разницы долей.
- Как использовать
- Выберите тип теста «Разница долей», укажите альтернативную гипотезу «Больше», введите размер выборки 100, нулевую долю 0.5 и альтернативную долю 0.6.
- Пример конфигурации
-
{ "testType": "proportion", "alternative": "greater", "alpha": 0.05, "sampleSize": 100, "nullProportion": 0.5, "alternativeProportion": 0.6 } - Результат
- Инструмент рассчитает статистическую мощность для заданных долей, помогая понять, достаточно ли 100 отправленных писем для статистически значимого подтверждения гипотезы о росте конверсии.
Проверить на примерах
barcodeСвязанные хабы
FAQ
Что такое статистическая мощность?
Это вероятность того, что статистический тест правильно отклонит ложную нулевую гипотезу. Проще говоря, это шанс обнаружить реальный эффект, если он действительно существует.
Какой уровень мощности считается приемлемым?
В большинстве научных исследований и коммерческих A/B-тестов общепринятым стандартом считается статистическая мощность 80% (0.80) или выше.
Как размер выборки влияет на мощность теста?
Увеличение размера выборки повышает статистическую мощность. Большее количество данных снижает стандартную ошибку, делая оценку более точной и чувствительной к изменениям.
В чем разница между двусторонней и односторонней гипотезой?
Двусторонняя гипотеза проверяет изменения в обоих направлениях (увеличение или уменьшение), а односторонняя — только в одном. Двусторонняя гипотеза требует большего размера выборки для достижения той же мощности.
Что такое уровень значимости (альфа)?
Это вероятность совершить ошибку первого рода, то есть найти эффект там, где его на самом деле нет. Стандартное значение альфа составляет 0.05 (5%).