概率问题-从大篮子中选择时重复
时间:2020-03-06 14:45:11 来源:igfitidea点击:
我需要向客户解释为什么在两次据说不同的考试之间出现了骗局。自Prob和Stats至今已有20年了。
我有一个生成的多项选择考试。
数据库中有192个问题,
随机选择100个(无重复)。
显然,如此生成的任何两次考试之间至少有8次重复的可能性为100%。 (深孔原理)
我如何计算出现的可能性
25个骗子?
50个骗子?
75个骗子?
-事后编辑-
我通过excel进行了此操作,并取了n-100的概率之和,
对于这个特定问题,概率为
n P(n+ dupes) 40 97.5% 52 ~50% 61 ~0
解决方案
它可能比我们想象的要高。我不会尝试重复这篇文章:http://en.wikipedia.org/wiki/Birthday_paradox
创建完第一门考试后,将有92个从未使用过的问题,还有100个已经使用过的问题。如果现在生成另一个包含100个问题的考试,那么我们将选择92个从未使用过的问题,以及100个已经使用过的问题。显然,我们将获得很多重复项。
我们可能会希望获得(100/192)* 100个重复题,即在任意两次随机选择的考试中,平均会有52个重复题。
如果我们希望概率为25或者75,或者其他,则有两种选择。
a)计算数学
b)模拟计算机上的一些运行
嗯,这对我真的真的很朦胧。但是有(192种选择100种)可能的考试,对不对?
并且有(100个选择N)个方法来选择N个重复项,每个都有(92个选择100-N个)方法来选择其余的问题,不是吗?
因此,选择N个重复对象的可能性不只是:
(100选择N)*(92选择100-N)/(192选择100)
编辑:因此,如果我们希望获得N个或者更多重复的机会,而不是正好是N个,则必须对N的所有值的分数的上半部分求和,从最小重复数到最多100个。
Errrr,也许...