C++随机数生成实例讲解

如果让你用C++来生成0——N-1之间的随机数,你会怎么做?你可能会说,很简单,看:

srand( (unsigned)time( NULL ) );
rand() % N;

仔细想一下,这个结果是随机的吗(当然,我们不考虑rand()函数的伪随机性)?
不是的,因为rand()的上限是RAND_MAX,而一般情况下,RAND_MAX并不是N的整数倍,那么如果RAND_MAX % = r,则0——r之间的数值的概率就要大一些,而r+1——N-1之间的数值的概率就要小一些。还有,如果N > RAND_MAX,那该怎么办?
下面给出一种比较合适的方案,可以生成任意范围内的等概率随机数 result。最后还有一个更简单的方法。
1、如果N<RAND_MAX+1,则要去除尾数,       

 R = RAND_MAX-(RAND_MAX+1)%N; //去除尾数
  t = rand();
  while( t > R ) t = rand();
  result = t % N; // 符合要求的随机数

2、如果 N>RAND_MAX,可以考虑分段抽样,分成[n/(RNAD_MAX+1)]段,先等概率得到段再得到每段内的某个元素,这样分段也类似地有一个尾数问题,不是每次都刚好分到整数段,一定或多或少有一个余数段,这部分的值如何选取?

选到余数段的数据拿出来选取,先进行一次选到余数段概率的事件发生,然后进行单独选取:      

 r = N % (RAND_MAX+1); //余数
  if ( happened( (double)r/N ) )//选到余数段的概率
  result = N-r+myrandom(r); // myrandom可以用情况1中的代码实现
  else
  result = rand()+myrandom(N/(RAND_MAX+1))*(RAND_MAX+1); // 如果选不到余数段再进行分段选取

完整的代码:

#include<iostream.h>
#include<time.h>
#include<stdlib.h>
const double MinProb=1.0/(RAND_MAX+1);
bool happened(double probability)//probability 0~1
{
 if(probability<=0)
 {
return false;
 }
 if(probability<MinProb)
 {
 return rand()==0&&happened(probability*(RAND_MAX+1));
 }
 if(rand()<=probability*(RAND_MAX+1))
 {
 return true;
 }
 return false;
}
long myrandom(long n)//产生0~n-1之间的等概率随机数
{
 t=0;
 if(n<=RAND_MAX)
 {
 long R=RAND_MAX-(RAND_MAX+1)%n;//尾数
 t = rand();
 while ( t > r )
 {
  t = rand();
 }
 return t % n;
 }
 else
 {
 long r = n%(RAND_MAX+1);//余数
 if( happened( (double)r/n ) )//取到余数的概率
 {
  return n-r+myrandom(r);
 }
 else
 {
  return rand()+myrandom(n/(RAND_MAX+1))*(RAND_MAX+1);
 }
 }
}
 
还有另外一种非常简单的方式,那就是使用
random_shuffle( RandomAccessIterator _First, RandomAccessIterator _Last ).
例如,生成0——N-1之间的随机数,可以这么写
#include <algorithm>
#include <vector>
long myrandom( long N )
{
 std::vector<long> vl( N ); // 定义一个大小为N的vector
 for ( long i=0; i<N; ++i )
 {
  vl[i] = i;
 }
 std::random_shuffle( vl.begin(), vl.end() );
 return (*vl.begin());
}
random_shuffle 还有一个三参数的重载版本
random_shuffle( RandomAccessIterator _First, RandomAccessIterator _Last, RandomNumberGenerator& _Rand )

第三个参数可以接受一个自定义的随机数生成器来把前两个参数之间的元素随机化。
这个方法的缺陷就是,如果只是需要一个随机数的话,当N很大时,空间消耗很大!