关键信息
- 分类
- 数学、日期与金融
- 输入类型
- select, number
- 输出类型
- json
- 样本覆盖
- 4
- 支持 API
- Yes
概览
统计功效计算器是一款专为研究人员和数据分析师设计的在线工具,用于快速估算单样本均值或比例检验的统计功效(Power)。通过输入样本量、显著性水平(Alpha)以及预期的效应大小(如均值差异或比例差异),该工具能自动计算出在特定条件下正确拒绝原假设的概率。无论是进行学术研究、A/B 测试还是质量控制,它都能帮助您评估实验设计是否具备足够的敏感度来检测出真实的差异,从而避免因样本量不足导致的假阴性结论。
适用场景
- •在实验或问卷调查开始前,评估现有样本量是否足以检测出预期的差异。
- •分析已完成的假设检验结果,判断未达到统计显著性是因为真实效应不存在,还是因为统计功效不足。
- •在 A/B 测试设计阶段,权衡样本量、显著性水平与预期转化率差异之间的关系。
工作原理
- •选择检验类型(均值差异或比例差异)并设定备择假设的方向(双侧、大于或小于)。
- •输入显著性水平(通常为 0.05)和已知的样本量。
- •根据检验类型,分别输入原假设与备择假设的均值及标准差,或输入原假设与备择假设的比例。
- •工具将自动计算效应量(Effect Size)和统计功效(Power),并以 JSON 格式输出精确结果。
使用场景
用户案例
1. 评估新教学方法的测试成绩差异
教育研究员- 背景原因
- 研究员希望评估一种新教学方法是否能提高学生的平均分。历史平均分为 100 分,标准差为 15 分。目前有 64 名学生参与新方法的测试。
- 解决问题
- 想要知道如果新方法能将平均分提高到 105 分,当前的样本量(64人)是否有足够的统计功效来检测出这一差异。
- 如何使用
- 选择“均值差异”和“双侧”检验,输入样本量 64,原假设均值 100,备择均值 105,标准差 15,显著性水平保持 0.05。
- 示例配置
-
{"testType": "mean", "alternative": "two-sided", "alpha": 0.05, "sampleSize": 64, "nullMean": 100, "alternativeMean": 105, "standardDeviation": 15} - 效果
- 计算得出统计功效约为 76.01%,效应量为 0.3333。研究员可知当前样本量略低于常规的 80% 功效标准,可能需要适当增加样本量。
2. 估算网页转化率 A/B 测试的功效
数据分析师- 背景原因
- 网站当前的注册转化率为 50%(0.5)。团队计划上线一个新版页面,预期能将转化率提升至 60%(0.6)。
- 解决问题
- 在仅能获取 100 个测试样本的情况下,评估能否有效检测出这 10% 的转化率提升。
- 如何使用
- 选择“比例差异”和“大于”检验(单侧),输入样本量 100,原假设比例 0.5,备择比例 0.6,显著性水平设为 0.05。
- 示例配置
-
{"testType": "proportion", "alternative": "greater", "alpha": 0.05, "sampleSize": 100, "nullProportion": 0.5, "alternativeProportion": 0.6} - 效果
- 工具输出对应的统计功效和效应量。分析师可根据结果判断功效是否达标,从而决定是否需要延长测试时间以收集更多样本。
用 Samples 测试
barcode相关专题
常见问题
什么是统计功效(Power)?
统计功效是指当备择假设为真时,假设检验正确拒绝原假设的概率(即 1 - β)。通常建议统计功效达到 0.8(80%)或以上,这意味着有 80% 的把握能检测出真实的差异。
均值检验和比例检验有什么区别?
均值检验用于连续型数据(如身高、测试分数),需要输入均值和标准差;比例检验用于分类数据(如转化率、合格率),只需输入预期的比例数值。
显著性水平(Alpha)如何影响统计功效?
显著性水平是犯第一类错误(假阳性)的概率。提高 Alpha(例如从 0.01 提高到 0.05)会增加统计功效,但同时也会增加误判的风险,需要在两者之间进行权衡。
为什么在均值检验中需要输入标准差?
标准差反映了数据的离散程度。数据越分散,背景噪音越大,检测出真实均值差异的难度就越高。因此,标准差是计算效应量和统计功效不可或缺的参数。
计算结果中的效应量(Effect Size)代表什么?
效应量衡量了原假设与备择假设之间差异的标准化大小。它独立于样本量,直观反映了差异在实际业务或研究中的显著程度。