关键信息
- 分类
- 数学、日期与金融
- 输入类型
- number, select
- 输出类型
- json
- 样本覆盖
- 4
- 支持 API
- Yes
概览
Fisher 精确检验计算器专为处理 2x2 列联表设计,特别适用于样本量较小或频数分布极不均匀的统计场景。通过输入四个单元格的观测频数,该工具能基于超几何分布计算出精确的 p 值和优势比(Odds Ratio),帮助研究人员在不满足卡方检验条件时,准确判断两个分类变量之间是否存在统计学显著的关联。
适用场景
- •当总样本量较小(通常小于 40)且无法使用标准卡方检验时。
- •当 2x2 列联表中至少有一个单元格的期望频数小于 5 时。
- •在医学临床试验或罕见事件分析中,需要获取比渐近法更准确的精确 p 值时。
- •需要计算优势比(Odds Ratio)以评估两组分类数据之间关联强度时。
工作原理
- •在单元格 A、B、C 和 D 中分别输入 2x2 矩阵的四个频数观测值。
- •根据研究目的选择备择假设类型:双侧(检测差异)、大于(右侧检验)或小于(左侧检验)。
- •设定显著性水平 Alpha(默认为 0.05)以及结果输出的小数保留位数。
- •系统通过超几何分布公式计算所有可能组合的概率,得出精确 p 值并判定是否拒绝原假设。
使用场景
医学研究中比较极少数患者在接受新疗法与传统疗法后的康复比例。
质量检测中对比两批次少量抽检产品的合格与不合格分布情况。
社会科学调查中分析小规模特定群体对某一政策的支持与反对态度是否存在性别差异。
用户案例
1. 罕见病临床疗效分析
医学研究员- 背景原因
- 研究员正在测试一种针对罕见病的药物,由于病例稀少,实验组仅 10 人,对照组 6 人。
- 解决问题
- 实验组 8 人康复,对照组仅 1 人康复,需要确认这种差异是否具有统计学意义。
- 如何使用
- 在单元格 A 输入 8(实验组康复),B 输入 2(实验组未康复),C 输入 1(对照组康复),D 输入 5(对照组未康复),选择双侧检验。
- 示例配置
-
cellA: 8, cellB: 2, cellC: 1, cellD: 5, alternative: 'two-sided', alpha: 0.05 - 效果
- 计算得出 p 值为 0.035,小于 0.05,结论为该药物疗效具有显著统计学差异。
2. 软件 A/B 测试小流量验证
产品运营- 背景原因
- 在灰度发布阶段,运营人员观察到新版页面在特定极小众渠道的转化情况。
- 解决问题
- 新版 12 人中有 10 人点击,旧版 10 人中仅 3 人点击,需判断新版是否显著优于旧版。
- 如何使用
- 输入 A=10, B=2, C=3, D=7,备择假设选择“大于(greater)”。
- 示例配置
-
cellA: 10, cellB: 2, cellC: 3, cellD: 7, alternative: 'greater' - 效果
- 得到单侧 p 值,帮助团队在样本量极小的情况下快速决定是否全量上线新版。
用 Samples 测试
math-&-numbersBDD with Cucumber - 行为驱动开发实践
全面的 Cucumber BDD 示例,包括功能文件、步骤定义、数据表格、钩子和高级 BDD 模式,用于协作开发
keywords test,table
Nginx 日志解析示例
用于测试 log-parser 工具的综合 Nginx 日志样本,包括访问日志和错误日志的各种格式和场景
task process
ELK Stack 日志分析示例
全面的 ELK Stack(Elasticsearch、Logstash、Kibana)示例,用于分布式系统中的日志聚合、处理和可视化
task process
重复行示例
用于测试重复行移除工具的各种重复行类型的示例文件
task process
常见问题
Fisher 精确检验和卡方检验有什么区别?
卡方检验是基于大样本的近似计算,而 Fisher 精确检验是基于超几何分布的精确计算,更适合小样本。
什么时候应该选择单侧检验?
当你预先假设某一组的发生率必然高于(或低于)另一组时使用单侧;若仅判断两组是否有差异则选双侧。
优势比 (Odds Ratio) 为 1 代表什么?
优势比为 1 意味着两组之间没有关联,即事件发生的概率在两组中是相同的。
如果 p 值正好等于 0.05 怎么办?
这通常被视为临界状态,建议结合置信区间和实际业务背景进行综合判断,或增加样本量重新实验。
该工具支持大于 2x2 的表格吗?
目前该计算器仅支持 2x2 列联表,对于更大规模的表格需要使用扩展的 Fisher-Freeman-Halton 检验。