关键信息
- 分类
- 数据与表格
- 输入类型
- textarea, number, select, checkbox
- 输出类型
- text
- 样本覆盖
- 4
- 支持 API
- Yes
概览
外键验证器是一款高效的数据完整性检查工具,旨在帮助用户快速识别两个数据集之间的引用关系是否一致。通过对比主键与外键列,该工具能精准定位缺失的关联记录、无效引用及孤立数据,确保数据库或电子表格中的数据逻辑严密。
适用场景
- •在合并不同来源的 CSV 或 Excel 数据表之前,检查关联字段是否存在引用错误。
- •数据库迁移或数据清洗过程中,识别并清理无法匹配到父表的孤立子记录。
- •定期审计业务报表,确保订单、用户或产品 ID 等关键关联字段的完整性。
工作原理
- •分别粘贴包含主键的父表数据和包含外键的子表数据。
- •指定主键列和外键列的索引位置(从 1 开始计数)。
- •选择验证模式(如查找缺失键或孤立记录)并设置大小写敏感等过滤选项。
- •点击验证,系统将生成详细的完整性报告或导出无效记录列表。
使用场景
电商订单核对:验证订单表中的用户 ID 是否均存在于用户基础信息表中。
库存管理审计:检查出库记录中的产品代码是否在库存主表中均有备案。
CRM 数据清洗:识别客户跟进记录中关联了已删除或不存在的客户 ID 的无效条目。
用户案例
1. 验证订单与用户关联性
数据分析师- 背景原因
- 分析师需要核对一份包含 5000 条订单的 CSV 文件,确保所有订单关联的用户 ID 都在用户主表中。
- 解决问题
- 部分订单记录关联了已注销的用户 ID,导致数据分析时出现空值错误。
- 如何使用
- 将用户主表粘贴至主键数据,订单表粘贴至外键数据,设置对应的列号并选择“仅查找无效键”。
- 示例配置
-
primaryKeyColumn: 1, foreignKeyColumn: 3, validationMode: 'invalid', outputFormat: 'csv' - 效果
- 工具导出了所有无法匹配到用户主表的订单记录,分析师可据此进行针对性清理。
用 Samples 测试
data-processingNeo4j 数据库示例
Neo4j图数据库示例,包括Cypher查询、数据建模和图算法
keywords data,relationships,database
Apache Arrow 示例
Apache Arrow 内存列式格式示例,用于高性能数据处理和分析
task format
BDD with Cucumber - 行为驱动开发实践
全面的 Cucumber BDD 示例,包括功能文件、步骤定义、数据表格、钩子和高级 BDD 模式,用于协作开发
keywords data
Grafana 高级应用示例
全面的 Grafana 示例,涵盖高级仪表板设计、告警配置、数据源集成和插件开发
keywords data
相关专题
数据库 Schema、迁移与 SQL 工作流工具
在一个专题中完成建表规划、SQL 生成、数据库变更对比、关系校验,以及将表格数据整理为可入库格式。
数据质量、去重与异常检测工具
在一个数据质量工作流专题里检查 CSV/JSON 数据集,比较表格版本,发现重复、离群值、缺失值问题、关联断裂和时序异常。
文本脱敏、高亮与展示格式化工具
在一个专题中比较文本脱敏、PII 检测、电话号码规范化、重点高亮、居中排版和 diff 格式化工具。
JSON 格式化、对比与规范化工具
在一个专题中比较 JSON 格式化、差异对比、日志审查、配置比较和数据规范化工具,适合需要让 JSON 更易读、更易审查的流程。
常见问题
什么是外键验证?
外键验证是检查子表中的引用值是否在父表中存在的过程,用于确保数据关联的准确性。
如何确定列号?
列号是从 1 开始的索引,例如第一列即为 1,第二列为 2,以此类推。
什么是孤立记录?
孤立记录是指在子表中存在,但在父表中找不到对应主键值的记录。
大小写敏感选项有什么作用?
开启后,系统会将 'ID001' 和 'id001' 视为不同的值;关闭则视为相同。
支持哪些输出格式?
支持详细报告、仅摘要、JSON 格式以及 CSV 格式(仅导出无效记录)。