构建因果有向无环图,探索 d-分离,计算 do-演算干预效应,发现 Simpson 悖论
有向无环图 (DAG) 编码因果假设:每个节点是一个变量,每条箭头 X→Y 表示 X 直接导致 Y。没有箭头是一个强声明——表示没有直接因果效应。Judea Pearl 的框架利用 DAG 确定哪些因果效应可以从观测数据中识别以及如何识别。
两个变量 X 和 Y 被集合 Z d-分离,当且仅当 X 与 Y 之间的每条路径都被阻断。路径被阻断的条件:(1) 链式 A→B→C,B 在 Z 中(对 B 做了条件化);(2) 叉式 A←B→C,B 在 Z 中;(3) 碰撞式 A→B←C,B 及其后代不在 Z 中。d-分离的变量在给定 Z 时条件独立。
一种治疗整体看有益但在每个子组中都有害(或反之)。解决方案取决于因果结构:如果分组变量是混杂因子,分层分析正确;如果是碰撞变量,整体分析正确。没有 DAG,仅凭统计无法判断哪个正确。
因果推断在流行病学(吸烟是否导致肺癌,还是遗传因素导致两者?)、经济学(教育是否增加收入,还是能力和家庭背景导致两者?)、政策评估(项目是否有效,还是选择偏倚导致结果?)、机器学习(公平性、可解释性和领域适应都需要因果推理)中至关重要。
编辑模式:点击「添加节点」创建变量,按住 Shift 依次点击两个节点创建边。双击节点删除,拖拽可重新摆放位置。D-分离模式:选择起点、终点和条件变量。DAG 会用绿色高亮开放路径,用红色标出阻断路径。干预模式:选择干预节点 do(X),概念上切断所有入边来模拟随机实验,并对比 P(Y|X=x) 与 P(Y|do(X=x))。