Alias方法的开源实现
时间:2020-03-06 14:39:23 来源:igfitidea点击:
我目前正在做一个项目,为了代码重用,我去寻找一个可以对项目执行某些概率接受/拒绝的库:
也就是说,有三个人(a,b c),每个人都有获得某物品的概率P {i},其中p {a}表示a的概率。这些概率是在运行时计算的,无法进行硬编码。
我想做的是生成一个随机数(用于一件物品),然后根据他们得到该物品的概率来计算谁得到该物品。别名方法(http://books.google.com/books?pg=PA133&dq=alias+method+walker&ei=D4ORR8ncFYuWtgOslpVE&sig=TjEThBUa4odbGJmjyF4daF1AKF4&id=ERSSDBDcYOIC&output=html)已准备就绪,但我想在这里进行说明实施,因此我不必编写它。
解决方案
这样会做吗?将所有p {i}放入数组,函数将向获得该项目的人返回索引。在O(n)中执行。
public int selectPerson(float[] probabilies, Random r) { float t = r.nextFloat(); float p = 0.0f; for (int i = 0; i < probabilies.length; i++) { p += probabilies[i]; if (t < p) { return i; } } // We should not end up here if probabilities are normalized properly (sum up to one) return probabilies.length - 1; }
编辑:我还没有真正测试过。我的观点是,我们描述的功能不是很复杂(如果我理解意思是的话),并且我们无需下载库即可解决此问题。
我只是测试了不完美的方法,但出于我的目的,我认为它应该足够了。 (常规代码,粘贴到单元测试中...)
void test() { for (int i = 0; i < 10; i++) { once() } } private def once() { def double[] probs = [1 / 11, 2 / 11, 3 / 11, 1 / 11, 2 / 11, 2 / 11] def int[] whoCounts = new int[probs.length] def Random r = new Random() def int who int TIMES = 1000000 for (int i = 0; i < TIMES; i++) { who = selectPerson(probs, r.nextDouble()) whoCounts[who]++ } for (int j = 0; j < probs.length; j++) { System.out.printf(" %10f ", (probs[j] - (whoCounts[j] / TIMES))) } println "" } public int selectPerson(double[] probabilies, double r) { double t = r double p = 0.0f; for (int i = 0; i < probabilies.length; i++) { p += probabilies[i]; if (t < p) { return i; } } return probabilies.length - 1; } outputs: the difference betweenn the probability, and the actual count/total obtained over ten 1,000,000 runs: -0.000009 0.000027 0.000149 -0.000125 0.000371 -0.000414 -0.000212 -0.000346 -0.000396 0.000013 0.000808 0.000132 0.000326 0.000231 -0.000113 0.000040 -0.000071 -0.000414 0.000236 0.000390 -0.000733 -0.000368 0.000086 0.000388 -0.000202 -0.000473 -0.000250 0.000101 -0.000140 0.000963 0.000076 0.000487 -0.000106 -0.000044 0.000095 -0.000509 0.000295 0.000117 -0.000545 -0.000112 -0.000062 0.000306 -0.000584 0.000651 0.000191 0.000280 -0.000358 -0.000181 -0.000334 -0.000043 0.000484 -0.000156 0.000420 -0.000372