c语言 - "n * (rand() / RAND_MAX)"是否进行偏斜随机数分布？ - c - Does "n * (rand() / RAND_MAX)" make a skewed random number distribution? 小贝子编程网

我想找到一种在 C 中获取随机数的无偏差方法（尽管我最多将它用于 0-20 的值，更有可能只有 0-8）。我见过这个公式，但在运行一些测试后，我不确定它是否偏斜。有什么帮助吗？

以下是使用的完整函数：

int randNum() 
{ 
    return 1 + (int) (10.0 * (rand() / (RAND_MAX + 1.0)));
}

我使用以下方法播种它：

unsigned int iseed = (unsigned int)time(NULL);
srand (iseed);

下面建议的那个拒绝为我工作，我试过

了

int greek; 
for (j=0; j<50000; j++) 
{ 
greek =rand_lim(5); 
printf("%d, " greek); 
greek =(int) (NUM * (rand() / (RAND_MAX + 1.0))); 
int togo=number[greek]; 
number[greek]=togo+1; 
}

它停止工作，当我注释掉 printf 时，它给了我相同的数字 50000 次。

是的，它是偏斜的，除非你的RAND_MAX恰好是 10 的倍数。

如果你把数字从0到RAND_MAX，并试图将它们分成10堆，你实际上只有三种可能性：

RAND_MAX是 10 的倍数，堆出来是均匀的。
RAND_MAX不是 10 的倍数，而且堆起来不均匀。
一开始，您将它分成不均匀的组，但扔掉所有会使它不均匀的"额外内容"。

你很少能控制RAND_MAX，无论如何，它通常是一个质数。这实际上只剩下 2 和 3 作为可能性。

第三个选项大致如下所示：[编辑：经过一番思考，我对此进行了修改，以产生0范围内的数字...（limit-1），以适应 C 和 C++ 中大多数事物的工作方式。这也简化了代码（一点点）。

int rand_lim(int limit) {
/* return a random number in the range [0..limit)
 */
    int divisor = RAND_MAX/limit;
    int retval;
    do { 
        retval = rand() / divisor;
    } while (retval == limit);
    return retval;
}

对于任何质疑这种方法是否会留下一些偏差的人，我还写了一个相当不同的版本，纯粹是为了测试。这个使用了一个范围非常有限的绝对非随机生成器，因此我们可以简单地遍历该范围中的每个数字。它看起来像这样：

#include <stdlib.h>
#include <stdio.h>
#define MAX 1009
int next_val() {
    // just return consecutive numbers
    static int v=0;
    return v++;
}
int lim(int limit) {
    int divisor = MAX/limit;
    int retval;
    do {
        retval = next_val() / divisor;
    } while (retval == limit);
    return retval;
}
#define LIMIT 10
int main() {
    // we'll allocate extra space at the end of the array:
    int buckets[LIMIT+2] = {0};
    int i;
    for (i=0; i<MAX; i++)
        ++buckets[lim(LIMIT)];
    // and print one beyond what *should* be generated
    for (i=0; i<LIMIT+1; i++)
        printf("%2d: %dn", i, buckets[i]);
}

因此，我们从 0 到 1009 的数字开始（1009 是素数，因此它不会是我们选择的任何范围的精确倍数）。因此，我们从 1009 个数字开始，并将其分成 10 个存储桶。这应该在每个桶中产生 100 个，而 9 个剩菜（可以这么说）被 do/while 循环"吃掉"。正如现在所写的那样，它分配并打印出一个额外的存储桶。当我运行它时，我在存储桶 0..9 中的每个存储桶中正好得到 100，在存储桶 10 中得到 0。如果我注释掉 do/while 循环，我会在 0..9 中的每一个中看到 100，在存储桶 10 中看到 9

。

可以肯定的是，我已经用生成的范围（主要使用的质数）和桶的数量重新运行了各种其他数字的测试。到目前为止，我还没有能够让它在任何范围内产生偏斜的结果（当然，只要启用了 do/while 循环）。

另一个细节：我在这个算法中使用除法而不是余数是有原因的。对于rand()的良好（甚至体面）实现，这是无关紧要的，但是当您使用除法将数字固定到某个范围时，您可以保留输入的上位。当您使用余数执行此操作时，您可以保留输入的较低位。碰巧的是，对于典型的线性同余伪随机数生成器，低位的随机性往往低于高位。一个合理的实现会抛弃一些最低有效位，使其变得无关紧要。另一方面，周围有一些非常糟糕的rand实现，并且对于其中的大多数，您最终通过使用除法而不是余数来获得更好的输出质量。

我还应该指出，有些生成器的作用大致相反——低位比上位更随机。至少根据我的经验，这些是相当罕见的。上位更随机的那些更常见。

c语言 - "n * (rand() / RAND_MAX)"是否进行偏斜随机数分布？

相关内容

最新更新

热门标签：