1. 导入 BI 前的交易数据体检
数据分析师背景
分析师收到了一份包含近期交易记录的 CSV 文件,准备将其导入 BI 工具制作销售看板。
问题
担心数据中存在缺失的客户邮箱、重复的订单记录或异常的超大金额,导致报表失真。
如何使用
将 CSV 文本粘贴到“数据集输入”中,在“重复判定列”填写 id,并将“示例行数”设为 8。
duplicateKeyColumns: id
sampleRows: 8结果
报告显示质量评分为 85 分,成功识别出 amount 列存在一个 9999 的数值异常(Outlier),以及 created_at 列存在日期格式漂移(混用 YYYY-MM-DD 和 MM/DD/YYYY)。