科学思考者15:科学结论的程序正义

2022-09-16 03:46:1215:46 37
所属专辑:每天朗读群
声音简介
我们每天都会收到各种号称是“科学”的信息,宇宙深处发现了一个黑洞、这里证明了一个猜想、新药研发成功、吃什么东西致癌、育儿专家提出了新的建议、心理咨询师讲了个好故事。这一讲咱们说说如何评估这些论断。我不是职业足球运动员但是我能看懂足球,我知道哪个动作犯规了哪个没犯规 —— 你不必是一个领域的专家,也能看明白专家们给的那些说法科学不科学,可信不可信。

你只要掌握“可信性”的门道就行。

*

数学,是绝对正确的。只要这篇论文能被同行评议审稿通过,在正规的学术期刊中发表,你就可以相信它。比如 2020 年中国科大的两个数学家证明了两个著名的微分几何猜想 [1],文章已经发表在顶级期刊上了,那么这件事儿立即就是板上钉钉的。如果有谁想给这两位数学家发奖金,马上就可以发,完全不用担心过段时间结果被人推翻。

这是因为数学不属于真实世界。数学研究的柏拉图世界里的事儿,只要逻辑正确就一定是正确的,而审稿人完全能保证论文的逻辑正确。

*

物理学,因为研究的是真实世界,光有逻辑正确就不够了。

早在爱因斯坦还在世的时候,物理学家就已经通过理论计算推导出来了“黑洞”这种东西。物理学家非常非常相信黑洞一定存在,霍金和彭罗斯等人更是早就算好了黑洞的各种性质……但是直到 2019 年,天文学家直接观测到一个黑洞,还给这个黑洞拍了照片,才算是确定了黑洞的存在。得到这个地步,诺贝尔奖委员会才敢给黑洞工作发奖,彭罗斯据此拿到 2020 年的诺贝尔物理学奖,而这时候霍金已经去世了。

物理学家对自己的理论是相当自信的。世界第一颗用在实战上的原子弹是美国在日本广岛投下的“小男孩”。这是一颗“铀弹”,用了50公斤的铀235 —— 而这其实是世界第一颗爆炸的铀弹,也是第一颗组装出来的原子弹。物理学家没用铀弹做过爆炸实验,第一颗就直接扔广岛了,这是因为铀弹的反应机制简单,物理学家认为自己不可能算错。投在长崎的那颗代号为“胖子”的原子弹则是一颗“钚弹”,用的是钚239。浓缩钚比浓缩铀便宜很多,但是钚弹更复杂,所以物理学家事先做过钚弹的爆炸实验。

这个道理是理论自信是来自研究对象的简单。物理学本质上是简单的。每个地方的物理定律都是一样的,所有同一类型的基本粒子都是全同的,每个电子并没有自己的独特个性。

物理学家上世纪六十年代就预言了“希格斯玻色子”的存在,然后 2012 年在大型强子对撞机(LHC)上就发现了*一次*希格斯玻色子的踪迹 —— 虽然这个事儿仅仅发生在法国和瑞士境内的一台仪器上,我们却是立即就可以宣布宇宙中遍布着希格斯玻色子。

*

化学、材料、工程、生物医学这些领域研究的东西都比物理学复杂得多,以至于理论推导已经根本无法得出有效结论,都必须做一下实验才知道。而实验都是有不确定性的。

我们都知道“实验误差”,但误差只是说你测出来的数值准不准。误差之外,你还可能你把假的当成真的,也可能把真的当成假的,你还需要知道实验结论的“可信度”。可信度是个难以严格定义的东西,现在通用的标准,是使用一个“p 值”,代表“实验结论纯属是个巧合”的可能性。这个 p 值越小,我们就认为实验结论越“显著”,也就约等于说是越“可信” [2]。我们可以大致地把 1-p 当做实验结果的可信性。

发现希格斯玻色子的那个实验的 p<0.0000006,也就是结论可靠的可能性大于 99.99994%(六个 9)。这么高的可信度是物理学实验的特色。如果你的研究涉及到“人”,p 值能有个 0.05 通常就算达标了。

*

医学、心理学、社会科学这些和老百姓关系最密切的研究,恰恰也是最不可信的。全世界的物理学都一样,全世界的人可不一样。这个药好不好使,这个方法对人到底有啥影响?跟人的性别、年龄、营养情况、受教育程度、工作性质、文化习俗、经济条件、环境气候都有关系。对这种复杂的局面我们需要强硬的证据才行,而证据是分等级的。

最弱的证据是“案例”。老王吃这个药治好了病,阿里巴巴公司使用的就是这种管理方法,那你能说这个药和那个方法就是对的吗?也许老王体质好,不吃药也能自愈;也许阿里要是不用那个管理方法,他们会更成功。“举例论证”不是科学方法。

科学方法讲究数据,常常需要“对照组”。最理想的方法,是所谓“大规模随机双盲对照试验”。我们把比如说两万人随机分成“实验组”和“对照组”两个组,实验组用这个新药,对照组用跟新药看起来一模一样的安慰剂。因为分组是随机的而且人数众多,我们可以认为两组人除了吃的药不一样,其他各方面都完全一样 —— 这就保证了如果这两组人的表现有任何显著的差别,一定是那个药导致的。得做一个这样的实验,发现实验组的情况确实好于对照组,而且 p 值很小,你才算证明了那个药有效。

2020 年新冠疫情,各国都在搞疫苗。截止到十一月,中国的疫苗号称有几十万人用过都没出问题,可是国际上并没有什么反应;美国的两支疫苗刚刚公布初步的结果,就立即被人欢呼,这是为啥呢?并不是人们歧视中国疫苗,而是中国疫苗还没有经过大规模随机实验的考验。中国把疫情控制得太好了,以至于中国境内几乎就没有感染者。如果你不打疫苗也不会感染新冠病毒,你就无法证明疫苗的有效性。所以中国必须去巴西和阿联酋这样疫情肆虐的地方做随机实验才行,而那些实验需要时间。对比之下,美国疫苗的实验人数虽然只有几万,但是因为其中有真正的感染风险,得到的是很强硬的证据。

大规模随机双盲对照实验是医学研究的黄金标准。但是这个黄金标准常常是难以达到的,而且就算达到了,有时候你感觉上也是怪怪的。

咱们看一个实战例子。

*

世界最大的制药公司是美国辉瑞公司(Pfizer)。辉瑞最畅销的产品是一种降低胆固醇的药物,叫立普妥(Lipitor)。立普妥的专利 2011 年过期。辉瑞斥资将近 10 亿美元开发了一个新药,托彻普(torcetrapib),来接立普妥的班。辉瑞需要证明托彻普的有效性和安全性。2006 年,辉瑞开展了托彻普的最后一轮 —— 也就是临床三期 —— 实验。实验把15003名病人随机分成两组,实验组用新药托彻普,对照组用以前的立普妥。

辉瑞必须证明,第一,托彻普比立普妥的疗效好;第二,托彻普的副作用不比立普妥严重。证明这两点,美国食品药物监督局才能允许托彻普上市。

实验进行了几个月之后,出问题了。实验组死了 82 个病人。

有病人死亡很正常,病人本来就是随机招募的,其中包括很多老人,很多病情严重的人,病人死亡不见得是因为你这个药。这就是双盲对照试验的好处:关键是我们得看看对照组死了多少人。对照组只死了 51 个人。

82 vs 51,辉瑞一看这个数字,就立即提前终止了实验,宣布新药失败。辉瑞不得不眼睁睁看着十亿美元研发费用打了水漂,坐等立普妥专利过期仿制药上市,而且公司股价市值当天就减少了 210 亿美元。为啥呢?因为实验组多死了两个人 [3]。

这个道理是这样的。即便实验组死的人数比对照组多,也有可能纯粹是个巧合 —— 可是多多少就不算是巧合了呢?你总要有个度数才行。整个实验开始之前,辉瑞对因为“副作用而死人”这件事设定的 p 值是 0.01。当死亡人数达到 82 vs 51 的时候,“这件事纯属巧合”的可能性,是 p=0.007,过线了。辉瑞愿赌服输,只好终止实验。

而事实上,哪怕实验组少死两个人,如果是 80 vs 51,那么 p 值就有 0.011,实验就可以继续进行下去。

*

你看这像不像考大学,成绩只差两分,结果有天壤之别。这就叫“程序正义”。

我们想要的是实质正义。我们想知道这个药到底有没有效,这个药的副作用有多大。特别是,你真正想知道的是这个药对“你”、对一个具体的人,会有什么效果 —— 但是对不起,科学回答不了那样的问题。也许新药的疗效比立普妥好得多只是副作用有点大,也许新药对大多数人是安全的 —— 但是对不起,那个问题更复杂,已经超出了实验的可行性。几万人参与,几亿美元的投入,最后也只能给你一个分数线式的、非黑即白的答案。

老百姓有时候会对科学有过高的期待,我们想要全部的事实。可是当你了解了科学这门业务的工作方式,你会意识到科学结论都是人做出来的。是一个个具体的科学家、花费有限的精力、使用有限的资源,一点一点把有限的事实积累起来,最后只能给你一个可信度有限的答案。

而有时候科学的程序正义会明显不同于实质正义。比如说,每个牙医都会告诉你,在每天刷牙的基础上,用牙线剔牙是个好习惯,说可以减少牙周疾病,避免牙龈出血,可以让你的牙齿更强壮。好,那用牙线科学吗?答案是*应该*科学,但没有大规模随机实验的证据。有人调研过几十项有关用牙线的研究,发现支持牙线的证据很弱。

可是你能说牙线没用吗?你不能。牙线的好处是个长期的效应,而现有的研究都只观察了患者几个月。那你说为什么不做长期研究呢?因为这不好做实验。你不能逼着对照组的人长期不用牙线,而自愿不用牙线的人可能根本不爱护牙,你很难把一个人的牙齿好归因于他爱用牙线。可是没有实验证据,就能说明这东西无效吗?

“没有证据表明这个东西有效(absence of evidence)” ≠ “有证据表明这个东西无效(evidence of absence)”

我建议你继续坚持用牙线。如果我们什么决定都依赖程序正义,日子也没法过。

*

除了数学是纯理论之外,任何科学结论要想被人正式接受,都必须既有理论机制,又有实验证据,达到程序正义。然而程序正义不是白给的,是花人花钱花时间一点一点做出来的,它就好像做工程一样有个可行性问题。

程序正义是有限的正义,科学知识是有限的认知。我们相信世界是讲理的,但是我们必须对科学这门业务有合理的期待。

用户评论

表情0/300
喵,没有找到相关结果~
暂时没有评论,下载喜马拉雅与主播互动
猜你喜欢
独立思考建立科学思维

建立独立思考的人生,不再随波逐流。

by:纳斯达克纳

极简科学·科学的力量

科学的力量,每天五分钟,搞定小学科学;160课堂,800分钟,高度浓缩的小学科学知识,循序渐进,螺旋上升,让孩子每天花费五分钟,搞定小学科学。内容涵盖小学科学课...

by:圆柱文化

科学

有0-8岁小孩的父母注意了!!!请用手机打开微信,搜索公众号:【有娃必看】———为了你小孩的美好未来请好好看看里面关于育儿、儿童教育全方面的权威专业知识吧!

by:投资理财读书圈

R3科学控糖科学饮食

不计算不挨饿控糖新生活6周重建饮食习惯让身体切换燃烧模式

by:发声的十五