如何假设检验中第一类错误与第二类错误的关系?

2022-12-20 09:26

2022-12-20 10:43

当假设检验拒绝了实际上成立的零假设时,所犯的错误称为第一类错误,其概率用α表示。当假设检验接受实际上不成立的零假设时,所犯的错误称为第二类错误,其概率用β表示。

第一类错误解释:

比如,某公司生产的100台手机里有5台是次品,所以次品率就是5%。但质检团队事先不知道这个信息,于是他们需要通过假设检验来验证。首先,质检团队假设次品率不超过5%,那么他们认为一次抽样是抽不到次品的(统计学中小概率事件的定义:概率小于5%的事件被认为在一次试验中不会发生)。

然而,当他们随机抽取一个手机来验证假设时,由于里面确实存在次品,谁也无法保证绝对就抽不到次品。

所以,如果现实中他们恰好抽中了一个次品(抽中的概率是5%),然后他们就会下决定说:“在只有5个次品的情况下,一次抽样我们认为是抽不到次品的,但现在我们真实地就抽到了次品,于是,我们拒绝次品率不超过5%的假设,怀疑这100台手机里的次品超过5台。”

很明显,他们犯错了,而犯错的概率就是那5个次品所占的比例:在原假设为真的情况下,他们仍有5%的可能性抽中次品,所以犯错的概率也就是5%。

因为抽中次品我们就会拒绝原假设,拒绝原假设,我们就犯错了(第一类错误:H0实际为真而拒绝H0),所以,此时犯错的概率就等于抽中次品的概率。

类似的,如果我们人为地规定低于5%的事件是小概率事件,在一次试验中不会发生,那么我们就注定了会有5%的可能性犯错,因为人为规定的那些小概率事件在现实中是可能发生的,而发生的概率就是我们规定的5%,即犯错的概率便等于小概率事件发生的概率。

第二类错误解释:

接下来,我们再来看看第二类错误及其概率的大小。仍然用上述例子进行说明,唯一变化的是现在100个手机中实际有10个次品,即同样的H0假设(次品率不超过5%)现在变成假了。

于是,质检团队仍先假设这100台手机中次品小于5个(H0),一次抽样,他们获得了一个正品,然后他们就说现在还不能拒绝H0,可以默认里面的次品数低于5个(统计学上不说接受H0)。

同样地,他们又犯错了,因为实际上的次品有10个,即H0是假的,他们需要拒绝H0可他们没有。那他们犯这个错误的概率是多大呢?90%。没错就是这么大,你可能会感到惊讶。

但这其中的逻辑是,在这个检验中,他们要做出正确的判断就需要拒绝H0,而拒绝H0需要他们一次抽样就抽中次品,因为次品个数是10个,正品是90个,所以,只要他们抽中正品,他们就会犯错,因而他们犯错的概率就是抽中正品的概率,即90%。直觉上也是这样。