统计功效计算器

关键信息

分类: 数学、日期与金融
输入类型: select, number
输出类型: json
样本覆盖: 4
支持 API: Yes

概览

统计功效计算器是一款专为研究人员和数据分析师设计的在线工具，用于快速估算单样本均值或比例检验的统计功效（Power）。通过输入样本量、显著性水平（Alpha）以及预期的效应大小（如均值差异或比例差异），该工具能自动计算出在特定条件下正确拒绝原假设的概率。无论是进行学术研究、A/B 测试还是质量控制，它都能帮助您评估实验设计是否具备足够的敏感度来检测出真实的差异，从而避免因样本量不足导致的假阴性结论。

适用场景

•在实验或问卷调查开始前，评估现有样本量是否足以检测出预期的差异。
•分析已完成的假设检验结果，判断未达到统计显著性是因为真实效应不存在，还是因为统计功效不足。
•在 A/B 测试设计阶段，权衡样本量、显著性水平与预期转化率差异之间的关系。

工作原理

•选择检验类型（均值差异或比例差异）并设定备择假设的方向（双侧、大于或小于）。
•输入显著性水平（通常为 0.05）和已知的样本量。
•根据检验类型，分别输入原假设与备择假设的均值及标准差，或输入原假设与备择假设的比例。
•工具将自动计算效应量（Effect Size）和统计功效（Power），并以 JSON 格式输出精确结果。

使用场景

心理学或医学研究中，评估特定受试者数量下，能否有效检测出治疗前后的指标变化。

互联网产品运营中，估算当前流量规模下，A/B 测试能否准确识别出按钮点击率的微小提升。

制造业质量控制中，判断抽样检测的样本量是否足够发现产品合格率低于标准值的情况。

用户案例

1. 评估新教学方法的测试成绩差异

教育研究员

背景原因: 研究员希望评估一种新教学方法是否能提高学生的平均分。历史平均分为 100 分，标准差为 15 分。目前有 64 名学生参与新方法的测试。
解决问题: 想要知道如果新方法能将平均分提高到 105 分，当前的样本量（64人）是否有足够的统计功效来检测出这一差异。
如何使用: 选择“均值差异”和“双侧”检验，输入样本量 64，原假设均值 100，备择均值 105，标准差 15，显著性水平保持 0.05。
示例配置: {"testType": "mean", "alternative": "two-sided", "alpha": 0.05, "sampleSize": 64, "nullMean": 100, "alternativeMean": 105, "standardDeviation": 15}
效果: 计算得出统计功效约为 76.01%，效应量为 0.3333。研究员可知当前样本量略低于常规的 80% 功效标准，可能需要适当增加样本量。

2. 估算网页转化率 A/B 测试的功效

数据分析师

背景原因: 网站当前的注册转化率为 50%（0.5）。团队计划上线一个新版页面，预期能将转化率提升至 60%（0.6）。
解决问题: 在仅能获取 100 个测试样本的情况下，评估能否有效检测出这 10% 的转化率提升。
如何使用: 选择“比例差异”和“大于”检验（单侧），输入样本量 100，原假设比例 0.5，备择比例 0.6，显著性水平设为 0.05。
示例配置: {"testType": "proportion", "alternative": "greater", "alpha": 0.05, "sampleSize": 100, "nullProportion": 0.5, "alternativeProportion": 0.6}
效果: 工具输出对应的统计功效和效应量。分析师可根据结果判断功效是否达标，从而决定是否需要延长测试时间以收集更多样本。

用 Samples 测试

barcode

相机 RAW 照片样本

可下载的相机 RAW 样本文件集合，涵盖 Sony ARW/SRF/SR2、Canon CR2/CR3/CRW、Adobe DNG、Nikon NEF/NRW、Fuji RAF、Olympus ORF、Panasonic RW2、Leica RAW/DNG 以及一个通用 RAW 二进制文件，适合测试上传与转换流程。

keywords sample

sample

Cypress E2E 测试框架

全面的Cypress端到端测试示例，包括测试设置、页面对象模型、API测试、视觉回归测试和现代Web应用的高级E2E模式

keywords test

sample

GitHub Actions Testing - CI/CD测试集成

全面的 GitHub Actions 测试工作流，包括自动化测试、并行执行、测试报告、缓存和现代开发流水线的高级 CI/CD 模式

keywords test

sample

ICS 日历样本

用于测试日历导入、事件解析、提醒与重复日程的 iCalendar (.ics) 文件样本

keywords sample

sample

常见问题

什么是统计功效（Power）？

统计功效是指当备择假设为真时，假设检验正确拒绝原假设的概率（即 1 - β）。通常建议统计功效达到 0.8（80%）或以上，这意味着有 80% 的把握能检测出真实的差异。

均值检验和比例检验有什么区别？

均值检验用于连续型数据（如身高、测试分数），需要输入均值和标准差；比例检验用于分类数据（如转化率、合格率），只需输入预期的比例数值。

显著性水平（Alpha）如何影响统计功效？

显著性水平是犯第一类错误（假阳性）的概率。提高 Alpha（例如从 0.01 提高到 0.05）会增加统计功效，但同时也会增加误判的风险，需要在两者之间进行权衡。

为什么在均值检验中需要输入标准差？

标准差反映了数据的离散程度。数据越分散，背景噪音越大，检测出真实均值差异的难度就越高。因此，标准差是计算效应量和统计功效不可或缺的参数。

计算结果中的效应量（Effect Size）代表什么？

示例结果

估算单样本均值检验功效

关键信息

概览

适用场景

工作原理

使用场景

用户案例

1. 评估新教学方法的测试成绩差异

2. 估算网页转化率 A/B 测试的功效

用 Samples 测试

相关专题

常见问题

API 文档

请求端点

请求参数

响应格式

AI MCP 文档

参数名	类型	必填	描述
testType	select	否	-
alternative	select	否	-
alpha	number	否	-
sampleSize	number	否	-
nullMean	number	否	-
alternativeMean	number	否	-
standardDeviation	number	否	-
nullProportion	number	否	-
alternativeProportion	number	否	-
decimalPlaces	number	否	-

统计功效计算器

示例结果

估算单样本均值检验功效

关键信息

概览

适用场景

工作原理

使用场景

用户案例

1. 评估新教学方法的测试成绩差异

2. 估算网页转化率 A/B 测试的功效

用 Samples 测试

相关专题

相关工具

常见问题

API 文档

请求端点

请求参数

响应格式

AI MCP 文档