简介

相信大家都在高中接触过超几何分布. 超几何分布是不放回的, 该分布给出了抽取次后抽到次品次数的概率. 如果一个随机变量服从于超几何分布, 那么有

其中为抽取到的次品数,为总数,为总次品数.

问题

生活中很多变量都服从于超几何分布, 我们举个例子

假设你们班要选出个人参加某个活动, 但是想要参加活动的人却有个人, 那么就要采取抽纸条的方式来选出参加活动的人. 准备张纸条, 其中有张是被标记了的.个候选人每人抽取一张纸条, 抽到被标记纸条的人就可以参加活动.

当已经有个人抽取了之后,个人里面有个人可以参加活动, 这个就服从于超几何分布. 现在我们想要讨论的问题是: 这样的抽取公平吗? 先抽和后抽对你抽到标记纸条的概率有没有影响? 再抽象一点, 即如果第次抽取时, 前面次抽取的结果都未知, 那么这次抽取抽到次品的概率是多少?

直觉告诉我们, 应该是公平的, 也就是说在这样一个无返回抽样中, 无论先后, 抽取到次品的概率都是一样的, 并且这个值应该就是.

证明

我们先说明几个数学符号, 以便后续推导

  • ,分别为次品数和总数
  • 分别为第次抽取抽取到的次品个数 (服从两点分布, 即其值要么要么)

首先, 我们可以立即得出,. 然后我们尝试计算

果然,也等于.

不过… 好像还是没有什么思路, 那我们继续计算

并且有

于是同样的.

现在我们思考,之间有什么关系. 我们想象有很多轨迹, 每条轨迹最终都可以到达这种情况, 而将所有的能达到的轨迹产生的概率相加, 就是.(第一次抽中, 第二次抽中) 和(第一次没抽中, 第二次抽中) 最终都可以达到第二次抽中这个结果 (也就是), 而也就只有这两条轨迹, 因此它们的概率相加便是.

类似的, 我们考虑的各个轨迹.的轨迹和的轨迹有没有什么关联? 当然有,的轨迹可以由的轨迹 “派生” 出来. 每一条轨迹都可以派生为两条轨迹, 比如说(第一次抽中, 第二次抽中), 这一条轨迹, 可以派生出(第一次抽中, 第二次抽中, 第三次抽中) 与(第一次抽中, 第二次没抽中, 第三次抽中) 两条轨迹, 即第二次抽中与没抽中的区别. 而的轨迹与的轨迹,的轨迹与的轨迹, 乃至的轨迹与的轨迹之间, 都有这种派生关系. 如果能够证明, 一条轨迹出现的概率等于其派生出的两条轨迹出现的概率之和 (前面的计算已经看出在时满足这种关系), 那么就能够用数学归纳法证明每次抽取抽到次品的概率是相同的. 于是就要证明

由于的某条轨迹派生出的轨迹的过程中, 轨迹前面个动作 (即是否抽取到) 是不变的, 因此用代替. 上面的式子显然成立, 于是我们就证明了. 也就是说, 游戏是公平的.

应用

据此, 我们可以轻松得出, 超几何分布的期望和二项分布是类似的. 即如果服从于超几何分布, 那么如果抽取次,(将看成一个概率).