早在1738年,伯努利就已提出决策分析中的效用概念。从1763年贝叶斯发表条件概率起就出现统计推断理论的萌芽。1815年拉普拉斯又将它推向一个新的阶段。统计推断理论实际上是在风险情况下的决策理论。1931年,拉姆齐基于效用和主观概率两个基本概念来研究决策理论。1944年 J.von诺伊曼和O.莫根施特恩在著名的《竞赛理论与经济行为》一书中,独立地研究了在不确定情况下进行决策所用的近代效用理论。沃尔德在1950年提出的统计决策函数是决策理论的又一重要进展。1954年萨维奇为决策方法提供了公理系统和严格的哲学基础。60年代初期,美国哈佛商学院开始运用统计决策理论解决商业问题,并定名为应用统计决策理论。1966年,美国霍华德首先应用决策分析这个名词。后来,决策分析又有许多新的发展,并广泛吸取有关的决策方法,从而形成一个内容广泛、实用性很强的学科分支。现代决策分析的发展动向是研究人们决策的行为思想方面和研制与计算机结合的决策支持系统等。
决策分析一般指从若干可能的方案中通过决策分析技术,如期望值法或决策树法等,选择其一的决策过程的定量分析方法。决策分析本质上比统计推断更复杂,因为它设计对决策的优化以及对不确定性的平均。决策分析本质上比统计推断更复杂,因为它涉及对决策的优化以及对不确定性的平均。在这里简要地列出了贝叶斯决策分析的要素。
贝叶斯决策分析的数学定义如下:
- 列举所有可能的决定和结果。
- 确定每个决策选项d的x的概率分布。用贝叶斯术语来说,这是条件后验分布,p(x|d)。在决策分析框架中,决策d不具有概率分布。所以我们不能说p(d)或p(x);所有的概率都必须以d为条件。
- 定义一个效用函数U(x),将结果映射到实数上。在简单的问题中,效用可能与单个连续的收益x相一致,例如寿命或净利润。如果结果x有多个属性,效用函数必须权衡不同的goods。
- 计算期望效用E(U(x)|d)作为决策d的函数,并选择期望效用最高的决策。在决策树中,可能会有两个或更多的决策,期望效用必须在每个决策点计算,条件是在该点之前的所有可用信息。
一个完整的贝叶斯决策分析包括所有这四个步骤。
- 确定性情况:每一个方案引起一个、而且只有一个结局。当方案个数较少时可以用穷举法,当方案个数较多时可以用一般最优化方法。
- 随机性情况:也称风险性情况,即由一个方案可能引起几个结局中的一个,但各种结局以一定的概率发生。通常在能用某种估算概率的方法时,就可使用随机性决策,例如决策树的方法。
- 不确定性情况:一个方案可能引起几个结局中的某一个结局,但各种结局的发生概率未知。这时可使用不确定型决策,例如拉普拉斯准则、乐观准则、悲观准则、遗憾准则等来取舍方案。
- 多目标情况:由一个方案同时引起多个结局,它们分别属于不同属性或所追求的不同目标。这时一般采用多目标决策方法。例如化多为少的方法、分层序列法、直接找所有非劣解的方法等。
- 多人决策情况:在同一个方案内有多个决策者,他们的利益不同,对方案结局的评价也不同。这时采用对策论、冲突分析、群决策等方法。
除上述各种方法外,还有对结局评价等有模糊性时采用的模糊决策方法和决策分析阶段序贯进行时所采用的序贯决策方法等。
当明确地平衡不确定性下的决策选项的成本和收益时,我们可以使用两种贝叶斯推理方法。首先,决策通常取决于预测数量(例如在给定的医疗条件下康复的概率),或者某一特定干预下的连续结果(如成本或功效)的期望值,而这又取决于未知参数,如回归系数和总体频率。我们使用后验推理来总结关于这些参数的不确定性,以及关于进入决策计算的预测的不确定性;我们使用贝叶斯推理的第二种方法是在决策分析中,根据先前决策所观察到的信息,确定相关参数和结果的条件分布,这种计算出现在多阶段决策树中,特别是在评估信息的预期价值时。
决策树是在已知各种情况发生概率的基础上,通过构成决策树来求取净现值的期望值大于等于零的概率,评价项目风险,判断其可行性的决策分析方法,是直观运用概率分析的一种图解法,决策树法有利于决策人员使决策问题形象比,可把各种可以更换的方案、可能出现的状态、可能性大小及产生的后果等,简单地绘制在一张图上,以便计算、研究与分析,同时还可以随时补充和不确定型情况下的决策分析。构建决策树的过程中常用的指标是信息增益,还有Gini值和信息增益比,下面以信息增益为主介绍这几个指标。
对于待划分的数据集D,其划分前样本集合D的熵(总体的经验熵)是一定的,但是根据某个特征X划分之后的熵(X条件经验熵)是不定的,X条件经验熵越小说明使用此特征划分得到的子集的不确定性越小(也就是纯度越高),因此$ 总体经验熵 - X条件经验熵 $差异越大,说明使用当前特征划分数据集D的话,其纯度上升的更快。而我们在构建最优的决策树的时候总希望能更快速到达纯度更高的集合,这一点可以参考优化算法中的梯度下降算法,每一步沿着负梯度方法最小化损失函数的原因就是负梯度方向是函数值减小最快的方向。同理:在决策树构建的过程中我们总是希望集合往最快到达纯度更高的子集合方向发展,因此我们总是选择使得信息增益最大的特征来划分当前数据集D。
由上我们知道计算信息增益(ID3算法)首先需要计算出总体的经验熵和条件经验熵,假设样本D有n个类别(特征),每个类别(特征)的概率是$ \frac{|C_n|}{D}
X条件经验熵计算公式如下:$$ H(D|X) = \sum_{i=1}^n{p_iH(D|X=x_i)} $$
则X的信息增益计算Gain(X)公式为:$$ Gain(D,X) = H(D) - H(D|X) $$
使用信息增益法(ID)存在信息增益偏向取值较多的特征的缺点,因为当特征的取值较多时,根据此特征划分更容易得到纯度更高的子集,因此划分之后的熵更低,由于划分前的熵是一定的,因此信息增益更大,信息增益比较偏向取值较多的特征。
因此当样本D中特征的取值较多时,可以使用信息增益比(C4.5算法)作为指标,信息增益比的本质是在信息增益的基础之上乘上一个惩罚参数,当特征个数较多时,惩罚参数较小;特征个数较少时,惩罚参数较大,因此其计算公式为:$$ 信息增益比 = 信息增益 * 惩罚参数 $$
惩罚参数计算公式:$$ 惩罚参数 = \frac{1}{H_X (D)} = \frac{1}{-\sum_{i=1}^n{\frac{|D_i|}{|D|}\log_2\frac{|D_i|}{|D|}}} $$ 其中的$ H_X(D) $是对于样本集合D,将当前特征X作为随机变量(取值是特征X的各个特征值),求得的经验熵。
最终得到X的信息增益比:$$ g_R (D,X) = \frac{Gain(D,X)}{H_X (D)} $$
信息增益比偏向取值较少的特征,因为当特征取值较少时$ H_X(D) $的值较小,因此其倒数较大,因而信息增益比比较大,因而偏向取值较少的特征。所以在使用信息增益比时并不是直接选择信息增益率最大的特征,而是现在候选特征中找出信息增益高于平均水平的特征,然后在这些特征中再选择信息增益率最高的特征。
除了信息增益和信息增益比这两个指标,常用的指标还有基尼指数(CART算法),基尼指数表示在样本集合中一个随机选中的样本被分错的概率,基尼指数越小表示集合中被选中的样本被分错的概率越小,也就是说集合的纯度越高,反之,集合越不纯,即$$ 基尼指数(基尼不纯度)= 样本被选中的概率 * 样本被分错的概率 $$
数学公式表示为:$$ Gini = \sum_{k=1}^K{p_k(1-p_k)} = 1 - \sum_{k=1}^K{p_k ^2} $$
其中$ p_k
对于样本集合D:$$ Gini(D) = \sum_{n=1}^N{(\frac{|C_n|}{|D|})^2} $$
需要说明的是CART算法生成的是个二叉树,也就是当使用某个特征划分样本集合只有两个集合:
- 等于给定的特征值的样本集合$ D_1 $。
- 不等于给定的特征值的样本集合$ D_2 $。
实际上是对拥有多个取值的特征的二值处理,因而对于一个具有多个取值(超过2个)的特征,需要计算以每一个取值作为划分点,对样本D划分之后子集的纯度$ Gini(D,X_i)
- 在数据集中计算出所有特征的信息增益指标(或信息增益比、Gini指数)。
- 挑选信息增益最大的X,然后按X的分组进行拆分数据集(例如X=1,2,3,则拆成3组,即X=1,2,3所对应的3个数据集),而信息增益最大的X将作为根进行判断。
- 依次在拆分后的数据集中继续计算出其他特征的信息增益。
- 继续挑选信息增益最大的特征,继续分组拆分,以此递归循环,直到满足以下两个条件之一,便可以停止循环。第一个条件:拆分后的数据集,只有y,没有x;这种情况是属于无法继续拆分,此时取y的众数为叶;第二个条件:拆分后的数据集,y列只有1个类别;例如在y全等于1的情况下,无论怎么拆分,y始终为1,那就没有继续拆分的必要了。
下面通过一个实例来了解贝叶斯推理在决策中的使用,示例结合了贝叶斯层次建模、概率决策分析和效用分析,平衡了暴露于氡气体的风险与测量房屋内氡水平并可能进行补救的成本。我们把这种分析看作是推理与决策分析完全集成的原型,超出了大多数应用程序的实际或可行范围,但表明了贝叶斯层次回归建模和个人集中决策之间的联系。
氡是一种致癌物质,是一种自然产生的放射性气体,其衰变产物也具有放射性,在高浓度下会导致肺癌。根据一项美国调查,氡平均照射量的分布近似为对数正态分布,几何平均值为0.67pCi/L,几何标准差为3.1(该分布的中位数为0.67 pCi/L,平均值为1.3pCi/L)。在美国,绝大多数房屋的氡含量并不高:约84%的房屋氡浓度低于2pCi/L。约90%低于3pCi/L。然而,调查数据显示,5万至10万户家庭的主要居住空间氡浓度超过20pCi/L,这一水平造成的年辐射照射量大致相当于铀矿工人的职业照射极限。
我们的决策问题包括测量氡浓度,并利用这一信息来帮助决定是否采取措施减少氡的风险。
在美国,最常用的测量方法是“筛选”测量法,这种短期测量是对居住区域年平均氡水平向上偏置的测量,在纠正了偏见之后。房屋的短期测量具有近似的对数正态分布,几何标准差约为1.8。
另一种氡测量方法远不如筛查测量方法常见,但在评估氡风险方面要好得多,那就是对氡浓度进行12个月的综合测量。长期观测直接测量了生活区域的年平均氡浓度。几何标准偏差约为1.2,成本约为50美元。在下面的讨论中,我们发现从成本效益的角度来看,长期度量比短期度量更有效。
如果家中的氡水平足够高,则个人可采取行动控制氡造成的风险,目前大多数家庭首选的补救方法是“分板减压”,它可以密封地板并增加通风,包括额外的取暖和制冷成本在内,成本约为2000美元,为简单起见,我们假设修复可以将氡浓度降低到2pCi/L,若初始年居住面积平均水平小于2 pCi/L,则整治无效。
我们认为个人业主有三种选择:
- 在不监测的情况下进行补救:花费2000美元对房屋进行补救,将氡暴露减少到2pCi/L。
- 什么都不做,接受目前的氡暴露。
- 对房子进行长期测量,花费50美元,根据测量的结果,决定是补救还是什么都不做。
测量/补救决策通常必须在不确定的情况下作出,因为大多数房屋没有测量氡。即使在测量后,氡水平也不能确切知道,因此,决策分析提出了两个挑战:首先,决定是否在已知氡照射的情况下进行补救;第二,考虑到目前关于家庭氡的知识状况,决定是否值得测量氡暴露。
目前已知房主的先验分布,这种先验分布不是一个主观量;相反,我们通过对一个国家氡测量样本的层次分析来确定它,如下所述。
在进行统计分析之前,我们调查已知氡暴露的房主的最佳决策,这个问题很难,因为它需要金钱和生命。我们用三个量来表示确定性下的决定,在线性无阈值剂量-反应关系下等效。
- $ D_d
$,与肺癌死亡概率降低$ 10^-6 $相关的的美元价值(本质上是“微生命”的价值): - $ D_r $, 家庭氡浓度在30年内降低1pCi/L的美元值;
- $ D_{action} $,如果你的氡水平是已知的,那么你应该补救的房屋氡水平。
采取行动的适当氡水平$ R_action
美国、英语、瑞典、加拿大政府建议的补救水平分别为$ R_{action} $ = 4,5,10和20pCi/L,若$ R_{remed} $ = 2pCi/L,则相当于每pCi/L$ D_r
我们的计算(假设是一个普通的美国家庭)掩盖了各个家庭之间的巨大差异。例如,包含一个不抽烟男性和一个不抽烟的女性,并且愿意每人花0.21美元来减少$ 10^{-6}
前面的讨论涉及确定性下的决策,个人房主可能对其住宅的氡暴露水平了解有限。一些研究人员的目标是确定与高水平氡平均照射量的家庭相关的地点和预测变量,以便有效地集中监测和补救。
- 从大约5000个房屋进行长期测量,随机选取125个县作为整群样本。
- 对美国所有县随机抽取的约8万所房屋进行了短期测量。
这是我们有时会看到的一种模式:相对少量的准确数据,伴随着大量有偏见和不精确的数据。其挑战在于用好的数据来校准坏的数据,这样就可以对整个国家做出推断,而不仅仅是长期测量样本中的125个县。
我们同时校准数据并预测氡水平,通过在房屋和县这一级上使用预测器,将分层模型拟合到两组测量值中,并使用单独的模型拟合到美国10个地区中的每一个。让$ y_i
其中$ \alpha_{j(i)}
利用包括气候数据和土壤中铀含量测量在内的县级预测指标W,表征j县地质特征的指标$ \delta_k(j)
还有递阶方差分量$ \tau
结合长期和短期测量,我们可以估计美国几乎每个县的氡水平分布,尽管主要取决于县内样本中的房屋数量,存在很大的不确定性。
不幸的是(从减少氡的角度来看),室内氡浓度即使在小范围内也变化很大。考虑到预测包含在模型中,氡水平的个体在一个指定的县只能预测内最多约1.9倍(也就是说,后几何标准差是1.9),和2.3倍更典型,考虑到3.1的因素,这是一个令人失望的巨大预测不确定性,因为除了房子在美国以外,没有任何关于房子的信息。另一方面,在美国这个看似温和的减少不确定性仍足以识别一些地区氡含量较高的家庭是非常罕见或非常常见的。例如,在大西洋中部各州。在一些县,超过一半的房屋的长期居住面积浓度超过了环保署建议的4pCi/L的行动水平,而在其他县,超过这个水平的不到0.5%。
我们使用拟合的层次回归模型对之前未测量的房屋i进行推理和决策分析,使用以下符号: $$ R_i = 房屋i的氡浓度 $$ $$ \theta_i = \log(R_i) $$
对于房屋i的决策,我们需要给定$ \theta_i
其中$ M_i
分布(9.5)总结了关于房屋氡水平的知识状态,只给出了其县和地下室的信息。在这方面,它作为房主的优先分配。现在假设在室内测量$ y \widetilde{} N(\theta, \sigma^2)
我们根据分布$ \theta_i
我们现在根据预测的家庭氡水平、氡导致肺癌死亡的额外风险、修复的影响和个人对风险的态度,制定出最优的测量和修复决策。给定一个行动水平下确定,$ R_action
决策树由三个分支组成。在每个分支,我们以美元为单位评估预期损失,使用$ D_r = 2000/(R_{action}−R_{remed})
- 在没有监控的情况下进行补救。预期损失为修复成本+修复后氡暴露的等值美元成本: $$ L_1 = 2000 + D_rE(min(R,R_{remed})) $$
-
不监测或补救。预期损失是氡暴露的等值美元成本: $$ L_2 = D_rE(R) = D_re^{M+\frac{1}{2}S^2} $$
-
测量y(以日志pCi/L测量)。直接损失是测量成本(假定为$50),此外,测量当年的氡照射量(是30年照射量(9.9)的$ \frac{1}{30} $)。内部决策有两个分支:
(一)进行补救措施。预期损失是由于测量的直接损失加上决策1计算的补救损失,但使用的是后验分布而不是先验分布:$$ L_{3a} = 50 + D_r\frac{1}{30}e^{M+\frac{1}{30}S^2} + 2000 + D_r[R_{remed}\Phi(\frac{\Lambda-\log(R_{remed})}{\sqrt{V}}) + e^{\Lambda+\frac{1}{2}V}(1 - \Phi(\frac{\Lambda + V - \log(R_{remed})}{\sqrt{V}}))] $$
其中$ \Lambda
&emps; (二)不补救。预期损失:$$ L_{3b} = 50 + D_r\frac{1}{30}e^{M+\frac{1}{2}S^2} + D_re^{\Lambda + \frac{1}{2}V} $$
决定是否纠正给定的度量。为了评估决策树,我们必须首先考虑3(a)和3(b)之间的内在决定,条件是在测量y上。设$ y_0
这里不提供我们求解这个方程的方法的细节。
立即补救的预期损失$ L_1
通过对测量中先前的不确定度y(给出测量变异性的值$ \sigma $)进行平均,如下所示:
- 模拟$ y \widetilde{} N(M, S^2 + \sigma^2) $的5000次绘图。
- 每绘制一次y,通过$ L_{3a}
$和$ L_{3b}$的表达式计算$ min(L_{3a},L_{3b}) $。 - $ L_3 $作为这5000个值的平均值估计。
只有当我们假设您将在进行度量后做出建议的最佳决策时,这种预期损失才有效。
我们现在可以比较预期损失$ L_1
如果我们愿意对所有县进行简化假设,即$ \sigma = \log(1.2)
- 如果$ e^M $小于1.0pCi/L(相当于68%的美国家庭),则不做任何事情。
- 如果$ e^M $在1.0至3.5pCi/L之间(27%的美国家庭),进行长期测量(然后决定是否进行补救)。
- 如果$ e^M $大于3.5pCi/L(美国房屋的5%),立即进行补救,无需测量。实际上,在这种情况下,如果我们将短期监测作为一种选择,那么它(几乎)没有成本效益。我们忽略了决策树的额外复杂性,因为它很少发生,而且对整体成本效益分析的影响很小。
图2地图显示:(a)在$ R_{action} = 4pCi/L $的完美信息行动水平下,建议测量的每个县的房屋比例;(b)一旦进行了测量,每个县建议进行补救的房屋的预期比例。对于目前的氡模型,在任何一个县,是否测量和是否补救的建议只取决于房屋类型:房屋是否有地下室和地下室是否用作生活空间。犹他州和南卡罗莱纳边界的明显不连续是由这些州进行的氡测量的不规范造成的,我们在这里忽略这个问题。
既然我们已经为个人房主提出了理想化的建议,我们考虑如果建议被所有美国房主遵循的话,会产生的总体影响 特别地,我们将个人遵循我们的建议的后果与其他政策的后果进行了比较,例如EPA含蓄地建议,将短期测量作为家庭销售的条件,并在测量超过4pCi/L时执行补救措施。
图2显示了基于4pCi/L行动级别$ R_{action} $的推荐测量(以及一年后推荐的补救措施)的地理格局。每个县都根据建议进行测量(然后进行修复)的房屋比例进行遮荫。这些建议在预测县内氡分布的模型中纳入了参数不确定性的影响,因此,随着更好的预测出现,这些地图预计将有所改变。
从政策的角度来看,也许地图的最显著的特征是,即使美国环保局推荐的行动4pCi/L水平假设是正确的,正如我们已经讨论的,它导致一个合理的$ D_r $的价值,在标准剂量反应assumptions-monitoring下仍不建议在大多数美国家庭。事实上,只有28%的美国家庭会进行氡监测。在标准假设下,8pCi/L的行动水平对于不吸烟者来说是一个合理的值,这将导致更严格的监测和补救:只有5%的家庭会执行监测。
如果在全国范围内应用下列每一种决策策略,我们估计总货币成本和挽救的生命:
- 决策分析中推荐的策略(即,用先前的平均估计值高于给定水平的房屋进行监测,并对那些测量值高的房屋进行补救)。
- 对所有房屋进行长期测量,然后对测量超过规定氡作用水平$ R_{action} $的房屋进行补救。
- 对所有房屋进行短期测量,然后对偏差校正测量超过指定氡作用水平$ R_{action} $的房屋进行补救(偏差由层次回归模型估计)。
- 对所有房屋进行短期测量,对未校正的测量超过规定的氡作用水平的房屋进行补救。
我们根据节省的总生命和美元成本来评估上述每一种策略,这些结果由氡行动水平$ R_{action} $参数化。挽救的生命和成本都被考虑为30年。对于每一种策略,我们假设所有房屋的等级反应都是相同的(这相当于一个统一的国家建议)。为了计算挽救的生命,我们假设每栋房子的家庭构成与美国的平均水平相同。我们通过汇总全国各个家庭的决策,来评估预期成本和预期挽救的生命数量。在我们的模型中,我们只需要考虑3078个县中每个县定义的三种房屋类型(没有地下室、地下室不作为居住空间、地下室作为居住空间)。
我们只详细描述基于层次模型的决策策略的预期成本和预期寿命计算的结果。如果所有地方都采用$ R_{action} = 4pCi/L $(如图2地图所示)的策略,美国7000万地面接触房屋中约26%将进行监测,4.5%将进行补救。被修复的房屋包括280万氡水平在4pCi/L以上的家庭(占所有此类家庭的74%),84万氡水平在8pCi/L以上的家庭(占所有此类家庭的91%)。估计总费用为73亿美元——测量费用为10亿美元,矫正费用为63亿美元——预计将在30年内挽救4.9万名吸烟者和3.5万名非吸烟者的生命。其他行动层面和其他决策策略所节省的总成本和总生命也以同样的方式计算。
图3显示了四种策略在30年期间预期成本和预期挽救生命之间的权衡。曲线上的数字是行动级别,$ R_{action}
图3 各种氡测量/补救措施的预期挽救生命与预期成本。数字表示$ R_{action} $的值。实线是建议的只测量某些家庭的策略;另一种则假设所有的房屋都是测量过的。所有的结果都是美国30年的估计数据。


