关键信息
- 分类
- 数学、日期与金融
- 输入类型
- textarea, select, number, checkbox
- 输出类型
- json
- 样本覆盖
- 2
- 支持 API
- Yes
概览
四分位距计算器是一款专业的统计分析工具,专门用于快速计算数据集的第一四分位数(Q1)、第三四分位数(Q3)以及四分位距(IQR)。通过衡量数据集中间 50% 的跨度,该工具能有效排除极端值的干扰,帮助用户准确评估数据的离散程度。此外,它还支持计算 1.5 倍 IQR 的异常值围栏(Tukey 围栏),是绘制箱线图和进行异常值检测的理想助手。
适用场景
- •需要绘制箱线图(Box Plot)并确定数据上下边界时。
- •数据集中存在极端异常值,需要使用抗干扰能力更强的指标来衡量数据离散程度时。
- •进行数据清洗,需要利用 Tukey 围栏(1.5 x IQR)快速识别和剔除异常数据点时。
工作原理
- •在文本框中输入或粘贴您的数值数据集,数值之间使用逗号或空格分隔。
- •根据统计需求选择合适的四分位计算方法(如线性插值、最近秩或排除端点百分位)。
- •勾选“包含异常值围栏”选项以自动计算上下限,并设置所需的小数保留位数。
- •点击计算,工具将即时输出 Q1、Q3、IQR 数值以及用于异常值检测的围栏边界。
使用场景
用户案例
1. 销售数据异常值检测
数据分析师- 背景原因
- 每月需要对各门店的日销售额进行汇总分析,但偶尔会有大客户采购导致单日销售额激增,影响整体趋势判断。
- 解决问题
- 需要计算销售额的正常波动范围,并找出那些异常偏高的销售日。
- 如何使用
- 将一个月的日销售额数据粘贴到“数据集”中,勾选“包含异常值围栏”,使用默认的“线性插值”方法。
- 示例配置
-
数据集: 1200, 1350, 1100, 1400, 5800, 1250, 1300 包含异常值围栏: true - 效果
- 工具输出 Q1、Q3 和 IQR,并计算出上限围栏。分析师可直观发现 5800 远超上限,属于异常值。
2. 实验数据离散程度评估
科研人员- 背景原因
- 在生物实验中测量了多组细胞的生长周期,数据中存在几个因操作失误导致的极端长周期。
- 解决问题
- 需要一个不受极端值影响的指标来描述细胞生长周期的集中趋势和离散程度。
- 如何使用
- 输入测量数据,选择“最近秩”计算方法,设置小数位数为 2。
- 示例配置
-
数据集: 24.5, 25.1, 24.8, 26.0, 45.2, 25.5 四分位方法: nearest-rank 小数位数: 2 - 效果
- 成功获取中间 50% 数据的跨度(IQR),排除了 45.2 等极端值的干扰,得到了更具代表性的实验数据离散度。
用 Samples 测试
qr常见问题
什么是四分位距(IQR)?
四分位距是第三四分位数(Q3)与第一四分位数(Q1)的差值,反映了数据集中间 50% 数据的分布跨度。
为什么使用 IQR 而不是标准差?
标准差容易受到极端值(异常值)的严重影响,而 IQR 只关注中间 50% 的数据,具有极强的抗干扰性,能更稳健地反映数据的真实离散情况。
异常值围栏(Outlier Fences)是如何计算的?
下限围栏计算公式为 Q1 - 1.5 * IQR,上限围栏为 Q3 + 1.5 * IQR。超出这个范围的数据点通常被视为异常值。
工具支持哪些四分位计算方法?
工具支持三种常见方法:线性插值(默认,适用于大多数连续数据)、最近秩和排除端点百分位方法,以满足不同统计软件或学术场景的标准。
输入的数据集有格式要求吗?
只需要输入纯数字即可,数字之间可以使用逗号、空格或换行符进行分隔,工具会自动解析并进行排序计算。