ExcelHome技术论坛

 找回密码
 免费注册

QQ登录

只需一步,快速开始

快捷登录

搜索
EH技术汇-专业的职场技能充电站 妙哉!函数段子手趣味讲函数 Excel服务器-会Excel,做管理系统 效率神器,一键搞定繁琐工作
HR薪酬管理数字化实战 Excel 2021函数公式学习大典 Excel数据透视表实战秘技 打造核心竞争力的职场宝典
让更多数据处理,一键完成 数据工作者的案头书 免费直播课集锦 ExcelHome出品 - VBA代码宝免费下载
用ChatGPT与VBA一键搞定Excel WPS表格从入门到精通 Excel VBA经典代码实践指南
楼主: toopoor

[原创] 生成不重复随机数的一段代码

  [复制链接]

TA的精华主题

TA的得分主题

发表于 2016-6-20 22:46 | 显示全部楼层
本帖最后由 小蚂蚁树 于 2016-6-22 21:14 编辑

学习了这里的很多内容。很多高手。。。
灰袍法师的等概率遍历法应该是直接符合概率的定义的,剩余多少值域,剩余多少要取的值,去匹配rnd的值。不过,从实现来说,可能会受到rnd精度的影响?

如果VBA里面rnd的最大有效数字15位,就是≥10^-15,要在1~10的20次方的值域里面取10个(初始概率是10^-19),那么前面的值段就无法满足了。只能等到后来(第10^16个数以后?),被除数越来越小,商越来越大,才可能大于rnd的值。随机性受到精度的影响。

我用excel里面的RAND()公式,几万个值的最小值也只是10^-5级别的。VBA可能也差不多?那么精度就差得更多了。

另外,洗牌法,其中随机位置的范围应该是递减的。开头递增,末尾不变。

另外,检验是否随机,我觉得一个简单的必要条件是(不是充分条件),生成的数的平均值是否接近理论平均值(不管是允许重复还是不允许重复),就是值域首尾两个数的算术平均值。

TA的精华主题

TA的得分主题

发表于 2016-6-22 21:17 | 显示全部楼层
[广告] Excel易用宝 - 提升Excel的操作效率 · Excel / WPS表格插件       ★免费下载 ★       ★ 使用帮助
学习了灰袍法师的另外一个随机步长的方法。思路很巧妙。         
不过,这种方法好像有一个缺陷,就是,在取的数比较多,即“空档”比较少的情况下,会倾向于出前面的值。影响了随机性。

TA的精华主题

TA的得分主题

发表于 2016-6-22 21:43 | 显示全部楼层
本帖最后由 小蚂蚁树 于 2016-6-22 22:04 编辑

比如在1到1000的范围内取900个随机数,理论上的平均值应该是500.5,而用这种方法得到的平均值一直是467左右。而1到500每次都是出现的。

我觉得是这段代码的原因:
  1. For i = 1 To split_place - 1
  2.     my_share = Round(arr(i) / sum * total_share, 0)
  3.     total_share = total_share - my_share
  4.     sum = sum - arr(i)
  5.     arr(i) = arr(i - 1) + 1 + my_share
  6.     loop_count = loop_count + 1
  7. Next i
复制代码

这句:Round(arr(i) / sum * total_share, 0),其中total_share是100,sum(假如不放大的话)≈450,而arr(i)(假如不放大的话)是在0到1之间。那么,只有当sum减小到<200的时候,才可能使得(arr(i) / sum * total_share)>0.5,即 my_share=1,否则 my_share 一直都是0。
sum从450减少到200,因为arr(i)平均值是0.5左右,所以 i 要到500以后,才可能使得 sum 变成200。  450-500*0.5=200

我添加了测试代码:
  1. Dim SumEnough As Boolean '本句添加
  2. For i = 1 To split_place - 1
  3.     my_share = Round(arr(i) / sum * total_share, 0)
  4.   If my_share > 0 And SumEnough = False Then '本句添加
  5.     MsgBox i & "," & arr(i) & "," & sum & "," & total_share & "," & my_share
  6.     SumEnough = True
  7.   End If
  8.     total_share = total_share - my_share
  9.     sum = sum - arr(i)
  10.     arr(i) = arr(i - 1) + 1 + my_share
  11.     loop_count = loop_count + 1
  12. Next i
复制代码

然后运行发现,每次都是 i 到500以上,才第一次出现 my_share >0。也就是说,此前500多个数是必然出现的。因此导致了随机性受到破坏。
当然,要按比例对应到“空档”,“空档”是整数,而比例是精度有限、“密度”不定的小数,两者之间有矛盾,可能无法避免这样的问题。

TA的精华主题

TA的得分主题

发表于 2016-8-4 09:43 | 显示全部楼层
请教:如果生成的数据要求符合平均值±标准差,如何调整代码?

TA的精华主题

TA的得分主题

发表于 2016-10-17 23:27 | 显示全部楼层

TA的精华主题

TA的得分主题

发表于 2016-12-26 21:53 | 显示全部楼层

TA的精华主题

TA的得分主题

发表于 2016-12-27 01:38 | 显示全部楼层

TA的精华主题

TA的得分主题

发表于 2019-1-28 05:49 | 显示全部楼层
灰袍法师 发表于 2011-1-24 16:23
洗牌算法(记住:不叫跳蚤算法)的弱点是占用 max-min大小的内存,
max-min=1亿的时候当然会内存不足

更好的附件在27楼和29楼,,请问同学, 29的附近下载不了,方便重新上传下吗?

TA的精华主题

TA的得分主题

发表于 2019-1-28 06:06 | 显示全部楼层
小蚂蚁树 发表于 2016-6-22 21:43
比如在1到1000的范围内取900个随机数,理论上的平均值应该是500.5,而用这种方法得到的平均值一直是467左右 ...

同学你好,  29楼的法师的代码 怎么下载不了,谢谢如果你有文件,谢谢上传下

TA的精华主题

TA的得分主题

发表于 2019-1-28 06:07 | 显示全部楼层
同学你好,  29楼的法师的代码 怎么下载不了,谢谢如果你有文件,谢谢上传下
您需要登录后才可以回帖 登录 | 免费注册

本版积分规则

手机版|关于我们|联系我们|ExcelHome

GMT+8, 2024-11-22 10:14 , Processed in 0.043450 second(s), 6 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 1999-2023 Wooffice Inc.

沪公网安备 31011702000001号 沪ICP备11019229号-2

本论坛言论纯属发表者个人意见,任何违反国家相关法律的言论,本站将协助国家相关部门追究发言者责任!     本站特聘法律顾问:李志群律师

快速回复 返回顶部 返回列表