ExcelHome技术论坛

 找回密码
 免费注册

QQ登录

只需一步,快速开始

快捷登录

搜索
EH技术汇-专业的职场技能充电站 妙哉!函数段子手趣味讲函数 Excel服务器-会Excel,做管理系统 效率神器,一键搞定繁琐工作
HR薪酬管理数字化实战 Excel 2021函数公式学习大典 Excel数据透视表实战秘技 打造核心竞争力的职场宝典
让更多数据处理,一键完成 数据工作者的案头书 免费直播课集锦 ExcelHome出品 - VBA代码宝免费下载
用ChatGPT与VBA一键搞定Excel WPS表格从入门到精通 Excel VBA经典代码实践指南
楼主: 三坛老窖

[分享] 基于哈希查找的老窖字典

  [复制链接]

TA的精华主题

TA的得分主题

发表于 2017-10-2 10:54 | 显示全部楼层
[广告] VBA代码宝 - VBA编程加强工具 · VBA代码随查随用  · 内置多项VBA编程加强工具       ★ 免费下载 ★      ★使用手册
三坛老窖 发表于 2017-10-2 00:03
看你的提问,估计你也是在琢磨一维下料问题。
“若每个数据前面方案用过之后,后面不能再用”
这个可以 ...

老师高明,猜对了大半,其实也是关于一维下料,但又不是,我最终的结果,是设定一定范围内的的目标值(例如3000~6000(材料长度).每步长100为一个目标值(规格))然后用大量数据测试,循环按算法跑出每一个目标值的“最小余料”,通过对比,最终确定“最小余料”的那一个目标值就是最适宜材料规格。我要的是优化选料方案,并不是一种或两种规格材料的开料优化方案。
香川老师的背包算法早有拜读,但与我的要求也有所不同。

TA的精华主题

TA的得分主题

 楼主| 发表于 2017-10-5 23:57 | 显示全部楼层
wzsy2_mrf 发表于 2017-10-1 11:41
一旦超过10万,就直接用sql好了,我想微软也是这么考虑的。

计算机的内存是有限的,当内存不足以装载程序运行所需的相关数据时,就需要考虑将其存放在硬盘等外存中,为提高对外存中数据的存取效率,才有了数据库,进而有了SQL。显而易见,用数据库+SQL的好处是不受空间限制(外存容量可视为无穷大),但就效率而言,远不如使用内存存放数据。所以,只有当你的应用所需的存储空间用内存不能解决时,不得已才使用数据库+SQL。
微软是很牛,我们都是在其提供的平台上工作的,但也别把它神话了,它不可能把每种应用情景都考虑到,要不它还提供VBA开发平台干嘛。
一楼附件中的两个应用实例,凑数的那个显然不适合用SQL来解决的,提取不重复数据的那个,倒是可用SQL,但效率比用字典就差远了。

TA的精华主题

TA的得分主题

发表于 2017-10-22 09:15 | 显示全部楼层

TA的精华主题

TA的得分主题

发表于 2017-11-14 08:50 | 显示全部楼层
在学校学过点数据结构皮毛的我,看到了哈希字典的vb实现,还是很佩服的

TA的精华主题

TA的得分主题

发表于 2017-11-20 23:16 | 显示全部楼层

TA的精华主题

TA的得分主题

 楼主| 发表于 2018-2-7 16:06 | 显示全部楼层
主楼不让编辑了,升级版的字典只能发这儿了。
----------------------------------------------------------
老窖字典v5.rar (55.48 KB, 下载次数: 150)
----------------------------------------------------------

升级内容:
1、导入了Zamyi发掘的API hash函数
2、碰撞处理由线性探测法改为链接法

升级后,因为使用了性能极佳的API hash函数,字典性能也相应的提升了一大截,使用这个API函数后,在小数据量(10万以下)的情况下,速度也不输给VBScript字典;碰撞处理改为链接法,使得字典的存、取、删逻辑更为清晰,代码也更为简洁,相比线性探测法,从我对100万随机数据存入字典,所显示的指标来看速度也应有所提升(未测试比较)。
100随机数据存入字典的指标值(字典尺寸100万,刚好存满)
哈希表占位比%:62%
平均查找次数:1.50次
最大查找次数:8-9次

这三个指标值,比较有意思,当字典尺寸(字典装满)变大,哈希表占位比收敛于61.8%,平均查找次数收敛于1.5,最大查找次数应该是:系数*ln(n),以上只是我的推测,看是否有坛友能从理论上证明我的推测成立与否。

灰袍法师在某个帖中曾说过,一个设计良好的hash查找,平均查找次数是1.7次,看来我这个能达到优秀了,呵呵……


TA的精华主题

TA的得分主题

发表于 2018-3-20 23:10 | 显示全部楼层
[广告] VBA代码宝 - VBA编程加强工具 · VBA代码随查随用  · 内置多项VBA编程加强工具       ★ 免费下载 ★      ★使用手册
三坛老窖 发表于 2018-2-7 16:06
主楼不让编辑了,升级版的字典只能发这儿了。
-------------------------------------------------------- ...

1. 支持字典的嵌套吗?
2. 支持64位excel吗?我看好像没有写兼容语句:
#if VBA6 AND WIN64 THEN

#else

#endif

TA的精华主题

TA的得分主题

 楼主| 发表于 2018-3-21 21:25 | 显示全部楼层
[广告] VBA代码宝 - VBA编程加强工具 · VBA代码随查随用  · 内置多项VBA编程加强工具       ★ 免费下载 ★      ★使用手册
本帖最后由 三坛老窖 于 2018-3-31 14:05 编辑
lxw6 发表于 2018-3-20 23:10
1. 支持字典的嵌套吗?
2. 支持64位excel吗?我看好像没有写兼容语句:
#if VBA6 AND WIN64 THEN

1. 支持字典的嵌套吗?
答:支持。除不能用对象做关键字外,所有VBScript字典支持的功能,都支持。

(答错了!上面的字典不支持字典嵌套)
2. 支持64位excel吗?...
答:我没有试过,估计不支持。如果你是64位系统,你可自己改一下代码,应该没有难度的。

TA的精华主题

TA的得分主题

发表于 2018-3-21 22:05 | 显示全部楼层
三坛老窖 发表于 2018-3-21 21:25
1. 支持字典的嵌套吗?
答:支持。除不能用对象做关键字外,所有VBScript字典支持的功能,都支持。

我使用excel2016 64位测试的,支持!
不过,速度没有你宣传的快。可能跟测试方法有关。
我是两列数匹配。从1000000开始顺序往下排。下面是测试结果:
前面是VBScripit字典耗时,后面是老窖字典耗时。
1. 1万数据:0.1s,0.2s
2. 5万数据:0.3s,0.8s
3. 10万数据:0.9s,1.5s
4. 20万数据:3.4s,3,1s
4. 50万数据:23.5s,7.3s
5. 100万数据:105s,14.8s
只有超过20万时才有明显优势。

评分

1

查看全部评分

TA的精华主题

TA的得分主题

 楼主| 发表于 2018-3-21 22:26 | 显示全部楼层
lxw6 发表于 2018-3-21 22:05
我使用excel2016 64位测试的,支持!
不过,速度没有你宣传的快。可能跟测试方法有关。
我是两列数匹配 ...

应该不会这么慢呀?能把你的测试代码发上来看一下吗?
目前能想到是,可能是你代码中没有设置字典尺寸,如果没有设置,则在存入条目时,字典会不断的扩容,这会严重影响字典的速度。
您需要登录后才可以回帖 登录 | 免费注册

本版积分规则

手机版|关于我们|联系我们|ExcelHome

GMT+8, 2024-12-23 12:04 , Processed in 0.039429 second(s), 12 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 1999-2023 Wooffice Inc.

沪公网安备 31011702000001号 沪ICP备11019229号-2

本论坛言论纯属发表者个人意见,任何违反国家相关法律的言论,本站将协助国家相关部门追究发言者责任!     本站特聘法律顾问:李志群律师

快速回复 返回顶部 返回列表