3. 在评估主观概率分布时的初始化
在决策分析中,专家常常被要求表达对某种量值的信念,如某一天以概率分布的形式呈现出的道-琼斯平均指数。这种分布的建构,常常是通过专家所选择对象的不同数值,而这些数值,对应于其主观概率分布的百分位( percentiles)。例如,判断者也许被要求选择一个数字如X90,这意味着他认为这个数字高于道-琼斯平均指数的主观概率是0.90。也就是说,他选择X90,所以他愿意接受9对1的几率,认为道-琼斯平均指数不能超过这个数值。根据几个对应于不同百分位数的这种判断,我们能够构造出道-琼斯平均指数的主观概率分布。
通过收集许多不同量值的主观概率分布,就有可能检验判断者的度量或校准(calibration)是否合适。在一组问题中,待估量值(assessed quan-tity)的真实值,恰好有II%落在他给出的XII值之下,那么该判断者被正确(或者外部)校准。例如,1%的量值,真实值应该落在X01之下,并且1%的量值,真实值在X99之上。因而,有98%的问题,真实值应该落在置信区间X01到X99之间。
几位研究人员(Alpert&Raiffa,1969,2l; Stael von Holstein,197lb;
Winkler,1967)根据大量的判断者已经得到许多量值的概率分布。这些分布表明,它们与合适的校准之间存在巨大而系统性的偏差。在大多数研究中,对于大约30%的问题,待估量值的实际值,或者小于X01,或者大于X99。也就是说,被试给出的置信区间过小,与他们关于待估量值的知识所能证明的相比,置信区间反映出更大的确定性。经验较少的被试和老练的被试,同样存在这种偏差,并且合适的记分规则的引入,也不能够消除这种偏差,而记分规则为外在校准提供了刺激(incentive)。这种效应至少部分可归因于初始化。
例如,为了选择X90为道-琼斯平均指数的数值,通常一开始就考虑它对道-琼斯的最佳估计值,然后向上调节这个数值。如果这种调节——和大多数其他调节一样——不充分,那么X90就不会足够大。一种类似的初始化效应,出现在X10的选择上,据推测向下调节它的最佳估计值能够得到X10。结果,置信区间X10到X90将会太小,而待估量值的分布,将会过于高耸(tight)。为了支持这种解释,有一种程序能够系统地改变主观分布,在这种程序中,最佳估计值并不作为初始值。
有两种不同的方法,能够得到给定量值(如道-琼斯平均指数)的主观概率分布:(i)要求被试选择与他的主观概率分布的指定百分位数相对应的道-琼斯数值,(ⅱ)要求被试估计真实值将会超过指定数值的概率。这两种程序在形式上是等同的,因此应该产生相同的分布。然而,它们暗示的是对于不同初始值的不同调节模式。在程序(i)中,通常的起始点,是对变量的最佳估计值。在程序(ⅱ)中,被试的注意力,可能一开始就被固定在问题中给出的数值上;或者,被试可能一开始就被固定在半分比率(even odds)或者50-50概率上,它是可能性估计中通常的起始点。在任何一种情况下,程序(ⅱ)得到的几率与程序(i)相比,都更不极端。
为了对比这两种程序,向一组被试出示一组24个量值(例如新德里到北京的空中距离),每一个问题让被试估计X10或者X90。另外一组被试,得到的是第一组关于24个量值中每一个量值判断的中位数。他们被要求估计每一个给定数值超过相应量值的真实值的几率。在没有任何偏差的情况下,第二组应该检索出指定给第一组的几率,也就是9:1。然而,如果半分比率或者给出的数值充当初始值,那么第二组的几率应该更不极端,也就是说,接近于1:1。实际上,所有问题,第二组给出的几率中位数都是3:1。当测试两个组的判断确定外部校准时发现,与早期的研究一致,第一组中的被试非常极端。实际上,他们规定的概率为0.10的可能性事件在24%的个案中实现了。与此相对,第二组的被试过于保守,他们指定的平均概率为0.34的可能性事件,实际上在26%的个案中实现了。这些结果,说明了校准的程度依赖于启发程序(the procedure of elicitation)的方式。
用户评论