关键信息
- 分类
- 数学、日期与金融
- 输入类型
- number
- 输出类型
- json
- 样本覆盖
- 4
- 支持 API
- Yes
概览
调整后 R 平方计算器是一款专业的统计工具,用于在回归分析中根据样本量和预测变量数量对 R 平方进行修正。与标准 R 平方不同,调整后 R 平方会惩罚模型中不必要的变量,从而更真实地反映模型对数据的解释能力,有效防止过拟合。
适用场景
- •在多元线性回归中比较具有不同数量预测变量的模型时。
- •评估向模型添加新变量是否真正提高了模型的解释力,而非仅仅是统计上的巧合。
- •在样本量较小的情况下,需要更准确地估计总体解释方差时。
工作原理
- •输入回归分析得到的原始 R 平方值(介于 0 到 1 之间)。
- •填写研究中的总样本量(观测值数量)以及模型中包含的预测变量(自变量)个数。
- •设置计算结果需要保留的小数位数以满足精度要求。
- •系统根据公式自动计算调整后 R 平方、模型惩罚项以及解释方差的百分比。
使用场景
学术论文中对回归模型有效性的标准化汇报与比较。
数据科学中特征筛选阶段,评估新增特征对模型性能的实际贡献。
金融预测模型中,在有限的历史数据样本下防止模型过度参数化。
用户案例
1. 评估营销模型复杂度
市场分析师- 背景原因
- 分析师正在建立一个预测销售额的模型,初始模型包含 3 个变量,R 平方为 0.82,样本量为 50。
- 解决问题
- 需要确定在当前样本规模下,该模型的解释力是否被变量数量过度夸大。
- 如何使用
- 在计算器中输入 R 平方 0.82,样本量 50,预测变量数 3。
- 示例配置
-
rSquared: 0.82, sampleSize: 50, predictorCount: 3 - 效果
- 计算得出调整后 R 平方为 0.8083,惩罚项为 0.0117,表明模型解释力依然稳健。
2. 小样本过拟合检测
医学研究员- 背景原因
- 研究员在一项只有 20 个样本的实验中使用了 5 个预测变量,得到了 0.75 的高 R 平方值。
- 解决问题
- 怀疑高 R 平方是由变量过多导致的虚假拟合。
- 如何使用
- 输入 R 平方 0.75,样本量 20,预测变量数 5。
- 示例配置
-
rSquared: 0.75, sampleSize: 20, predictorCount: 5 - 效果
- 调整后 R 平方显著下降至 0.6607,提醒研究员模型可能存在过拟合风险,需简化变量。
用 Samples 测试
math-&-numbersCypress E2E 测试框架
全面的Cypress端到端测试示例,包括测试设置、页面对象模型、API测试、视觉回归测试和现代Web应用的高级E2E模式
keywords regression
AWS EventBridge 示例
AWS EventBridge 示例,包括事件总线、规则、目标、模式注册表、自定义事件和跨账户事件路由,适用于无服务器事件驱动架构
keywords count
Grafana 高级应用示例
全面的 Grafana 示例,涵盖高级仪表板设计、告警配置、数据源集成和插件开发
keywords metrics
K6 现代性能测试工具
全面的 K6 性能测试示例,包括负载测试、压力测试、API性能测试和现代应用程序的高级测试模式
keywords metrics
相关专题
常见问题
为什么调整后 R 平方通常比 R 平方小?
因为它引入了对预测变量数量的惩罚机制,旨在抵消因增加变量而导致的 R 平方虚高。
调整后 R 平方会出现负值吗?
是的,如果模型的预测能力极差,或者预测变量过多而样本量太小,计算结果可能会变成负数。
在模型选择时,应该看哪个指标?
在比较变量数量不同的模型时,应优先参考调整后 R 平方,因为它考虑了模型的复杂性。
预测变量数量是否包含截距项?
不包含,预测变量数量仅指模型中独立自变量的个数。
样本量的大小如何影响调整后 R 平方?
样本量越小,增加预测变量带来的惩罚就越重,调整后 R 平方与原始 R 平方的差距就越大。