本福特定律可视化

探索首位数定律 P(d)=log10(1+1/d),验证自然数据的首位数字分布规律,进行卡方拟合优度检验

支持逗号、空格、换行符分隔的正数

Examples:

数据集信息

总数据量 -
有效数据 -
无效数据 -

卡方检验 (Chi-Squared Test)

统计量 -
临界值 (alpha=0.05) 15.507
P 值 -
结论 -

公式

P(d) = log10(1 + 1/d)

P(d) = log10(1 + 1/d), d = 1, 2, ..., 9

理论分布 vs 实际分布

数字 理论概率 实际频率 计数 偏差

什么是本福特定律?

本福特定律(Benford's Law),又称首位数定律,是指在许多自然生成的数值数据中,首位数字的出现概率遵循特定规律:以 1 开头的概率约为 30.1%,而以 9 开头的概率仅为 4.6%。

为什么会出现本福特定律?

这是因为数值在对数尺度上呈均匀分布。当我们从 1 数到 9,跨越了对数尺度上 1 到 2 之间的大部分范围,而 8 到 9 只占很小部分。因此,首位数字越小,出现的概率越大。

实际应用

关键洞察

  • 数据量越大,实际分布越接近理论预测(大数定律)
  • 均匀随机数不符合本福特定律,因为均匀分布在对数尺度上不均匀
  • 跨越多个数量级的数据(如人口、GDP)更容易符合本福特定律
  • 卡方检验可以定量评估数据对本福特定律的拟合程度
  • 质数也近似符合本福特定律,但收敛速度较慢

卡方统计量衡量实际观测与理论预期的偏差程度。当统计量小于临界值时,数据在95%置信水平上符合本福特定律。