English 中文(简体)
Alias方法的开源实现[closed]
原标题:
  • 时间:2008-09-24 11:45:01
  •  标签:

我们不允许为书籍、工具、软件库等寻求推荐的问题。你可以编辑问题,这样就可以用事实和引文来回答问题。

Closed 5 years ago.

我现在正在做一个项目,为了代码重用,我去寻找一个可以对项目执行一些概率接受/拒绝的库:

即,有三个人(a,bc),他们每个人都有获得一个项目的概率P{i},其中P{a}表示a的概率。这些概率是在运行时计算的,不能硬编码。

我想做的是(为一个物品)生成一个随机数,并根据获得该物品的概率计算谁获得了该物品。别名方法(http://books.google.com/books?pg=PA133&dq=别名+方法+walker&;ei=D4ORR8ncFYuWtgOslpVE&;sig=TjEThBUa4odbGJmjyF4daF1AKF4&;id=ERSSDBDcYOIC&;output=html)解释了如何实现,但我想看看是否有现成的实现,这样我就不必编写了。

最佳回答

这样的东西行吗?将所有p{i}s放入数组中,函数将向获取该项的人返回一个索引。在O(n)中执行。

public int selectPerson(float[] probabilies, Random r) {
    float t = r.nextFloat();
    float p = 0.0f;

    for (int i = 0; i < probabilies.length; i++) {
        p += probabilies[i];
        if (t < p) {
            return i;
        }
    }

    // We should not end up here if probabilities are normalized properly (sum up to one)
    return probabilies.length - 1;      
}

编辑:我还没有真正测试过这个。我的观点是,你描述的函数不是很复杂(如果我正确理解你的意思的话),你不应该下载库来解决这个问题。

问题回答

这是一个Ruby实现:https://github.com/cantino/walker_method

我刚刚测试了上面的方法——它并不完美,但我想就我的目的而言,它应该足够了。(groovy中的代码,粘贴到单元测试中…)

    void test() {
        for (int i = 0; i < 10; i++) {
            once()
        }
    }
    private def once() {
        def double[] probs = [1 / 11, 2 / 11, 3 / 11, 1 / 11, 2 / 11, 2 / 11]
        def int[] whoCounts = new int[probs.length]
        def Random r = new Random()
        def int who
        int TIMES = 1000000
        for (int i = 0; i < TIMES; i++) {
            who = selectPerson(probs, r.nextDouble())
            whoCounts[who]++
        }
        for (int j = 0; j < probs.length; j++) {
            System.out.printf(" %10f ", (probs[j] - (whoCounts[j] / TIMES)))
        }
        println ""
    }
    public int selectPerson(double[] probabilies, double r) {
        double t = r
        double p = 0.0f;
        for (int i = 0; i < probabilies.length; i++) {
            p += probabilies[i];
            if (t < p) {
                return i;
            }
        }
        return probabilies.length - 1;
    }

outputs: the difference betweenn the probability, and the actual count/total 
obtained over ten 1,000,000 runs:
  -0.000009    0.000027    0.000149   -0.000125    0.000371   -0.000414 
  -0.000212   -0.000346   -0.000396    0.000013    0.000808    0.000132 
   0.000326    0.000231   -0.000113    0.000040   -0.000071   -0.000414 
   0.000236    0.000390   -0.000733   -0.000368    0.000086    0.000388 
  -0.000202   -0.000473   -0.000250    0.000101   -0.000140    0.000963 
   0.000076    0.000487   -0.000106   -0.000044    0.000095   -0.000509 
   0.000295    0.000117   -0.000545   -0.000112   -0.000062    0.000306 
  -0.000584    0.000651    0.000191    0.000280   -0.000358   -0.000181 
  -0.000334   -0.000043    0.000484   -0.000156    0.000420   -0.000372




相关问题
热门标签