3
社区成员




本书聚焦于用简单和自然的方法定义因果参数,并且说明在观察性研究中,哪些假设对于估计参数是必要的。我们也证明这些假设可以用显而易见的数学描述出来,也可以用简单的数学工具将这些假设转化为量化的因果关系,如治疗效果和政策干预,以确定其可检测内在关系。
本书由四章组成。第1章介绍了基本的统计、概率和图论的概念,它们是理解本书剩余部分所需要的。本章还介绍了因果关系的基本概念,包括因果模型,并通过实例解释了该模型如何表示纯数据无法提供的信息。
第2章解释了因果模型是如何通过统计依赖模式在数据中得到反映的。它解释了如何确定一个数据集是不是符合给定的因果模型,并简要讨论了如何寻找解释给定数据集的模型。
第3章涉及如何使用因果模型进行预测,特别强调对于政策干预结果的预测。这里我们介绍了利用协变量的校正和反概率加权来降低混杂偏差的技术。本章还介绍了中介效应,并深入研究了迄今为止讨论的因果方法如何在线性系统中工作。这些方法的关键是回归系数和结构参数之间的根本区别,以及学生应该如何使用回归系数和结构参数来预测线性模型中的因果效应。
第4章介绍了反事实的概念:如果我们在过去的某个时刻做出了不同的选择,将会发生什么呢?讨论了如何计算反事实,如何估计反事实的概率,以及讨论我们能用反事实回答什么实际问题。因为新颖的符号和设问形式,这一章内容有点超前。然而,我们使用与之前章节相同的科学模型来阅读和计算反事实,这会使学习本书的学生和教师们能够轻松理解有关反事实的分析。对于那些希望在对数学要求不高的层面上理解反事实的读者来说,本章是一个好的起点,同时本章也为本书使用的基于模型的方法与一些实验科学家在统计学中追寻的潜在结果框架方法建立联系打下了坚实的基础。
因果性是理解和应用数据的核心,如果无法从数据中获知因果关系,则甚至无法回答诸如“治疗方案对病人有益还是有害”这类基本的问题。虽然现在有很多关于数据分析统计方法的教科书,但到目前还没有适合初学者水平的书,介绍如何从数据中快速梳理因果信息的各种方法。
本书弥补了这种缺憾。该书使用简单的实例与朴实的语言介绍了如何定义因果关系,在各种情形下估计因果参数所必需的假设,如何数学化地表示这些假设,这些假设是否有可检测的蕴涵,如何预测干预的效应,以及如何进行反事实推理等。这些都是有兴趣用统计方法回答因果问题的学生需要掌握的基本工具。
本书适用于对解释数据感兴趣的任何读者,本书的实例来自不同领域,涵盖医学、公共政策以及法律等。