ExcelHome技术论坛

 找回密码
 免费注册

QQ登录

只需一步,快速开始

快捷登录

搜索
EH技术汇-专业的职场技能充电站 妙哉!函数段子手趣味讲函数 Excel服务器-会Excel,做管理系统 效率神器,一键搞定繁琐工作
HR薪酬管理数字化实战 Excel 2021函数公式学习大典 Excel数据透视表实战秘技 打造核心竞争力的职场宝典
让更多数据处理,一键完成 数据工作者的案头书 免费直播课集锦 ExcelHome出品 - VBA代码宝免费下载
用ChatGPT与VBA一键搞定Excel WPS表格从入门到精通 Excel VBA经典代码实践指南
楼主: 三坛老窖

[分享] 基于哈希查找的老窖字典

  [复制链接]

TA的精华主题

TA的得分主题

发表于 2018-3-23 21:50 | 显示全部楼层
[广告] Excel易用宝 - 提升Excel的操作效率 · Excel / WPS表格插件       ★免费下载 ★       ★ 使用帮助
下面是加强版字典中进行传统字典和加强版字典对比测试的语句:

  1. Sub 大量数据匹配_新字典()
  2. '    Dim d As New Jobject '声明dict
  3. '    d.SetCapacity 5000000 '设置字典的大小
  4.     '之后添加key和item等和正常字典一样目前在用数组循环添加key和item时需要这样,只支持字符串类型
  5. '    d.Add CStr(arr(i, 1)), CStr(arr(i, 2))
  6.     t1 = Timer()
  7.     Lst1 = Cells(Rows.Count, 1).End(xlUp).Row
  8.     arr1 = Range("a1").Resize(Lst1, 2).Value
  9.     Dim d As New JObject '声明dict
  10.     d.SetCapacity 5000000 '设置字典的大小
  11.     For i = 1 To Lst1
  12.         d.Add CStr(arr1(i, 1)), CStr(arr1(i, 1))
  13.     Next i
  14.     Dim arr3(1 To 1000000, 1 To 1)
  15.     For i = 1 To Lst1
  16.         arr3(i, 1) = d(arr1(i, 2) & "")
  17.     Next i
  18.     Erase arr1, arr3
  19.     Set d = Nothing
  20.     MsgBox Round(Timer - t1, 1) & "秒!"
  21. End Sub
复制代码

详见http://club.excelhome.net/thread-1382920-1-1.html
确实没有设置字典大小,我再试试看。

TA的精华主题

TA的得分主题

发表于 2018-3-23 21:51 | 显示全部楼层
[广告] VBA代码宝 - VBA编程加强工具 · VBA代码随查随用  · 内置多项VBA编程加强工具       ★ 免费下载 ★      ★使用手册
下面是加强版字典中进行传统字典和加强版字典对比测试的语句:

  1. Sub 大量数据匹配_新字典()
  2. '    Dim d As New Jobject '声明dict
  3. '    d.SetCapacity 5000000 '设置字典的大小
  4.     '之后添加key和item等和正常字典一样目前在用数组循环添加key和item时需要这样,只支持字符串类型
  5. '    d.Add CStr(arr(i, 1)), CStr(arr(i, 2))
  6.     t1 = Timer()
  7.     Lst1 = Cells(Rows.Count, 1).End(xlUp).Row
  8.     arr1 = Range("a1").Resize(Lst1, 2).Value
  9.     Dim d As New JObject '声明dict
  10.     d.SetCapacity 5000000 '设置字典的大小
  11.     For i = 1 To Lst1
  12.         d.Add CStr(arr1(i, 1)), CStr(arr1(i, 1))
  13.     Next i
  14.     Dim arr3(1 To 1000000, 1 To 1)
  15.     For i = 1 To Lst1
  16.         arr3(i, 1) = d(arr1(i, 2) & "")
  17.     Next i
  18.     Erase arr1, arr3
  19.     Set d = Nothing
  20.     MsgBox Round(Timer - t1, 1) & "秒!"
  21. End Sub
复制代码

详见http://club.excelhome.net/thread-1382920-1-1.html
确实没有设置字典大小,我再试试看。

TA的精华主题

TA的得分主题

发表于 2018-3-24 00:54 | 显示全部楼层
[广告] Excel易用宝 - 提升Excel的操作效率 · Excel / WPS表格插件       ★免费下载 ★       ★ 使用帮助
下面是加强版字典中进行传统字典和加强版字典对比测试的语句:

  1. Sub 大量数据匹配_老窖字典()
  2.     t1 = Timer()
  3.     Lst1 = Cells(Rows.Count, 1).End(xlUp).Row
  4.     arr1 = Range("a1").Resize(Lst1, 2).Value
  5.     Set d = New OldCellarDictionary
  6.     With d
  7.         .Size = Lst1 '设置字典的大小
  8.     End With
  9.     For i = 1 To Lst1
  10.         d.Add CStr(arr1(i, 1)), CStr(arr1(i, 1))
  11.     Next i
  12.     Dim arr3(1 To 1000000, 1 To 1)
  13.     For i = 1 To Lst1
  14.         arr3(i, 1) = d(arr1(i, 2) & "")
  15.     Next i
  16.     Erase arr1, arr3
  17.     Set d = Nothing
  18.     MsgBox Round(Timer - t1, 1) & "秒!"
  19. End Sub
复制代码

详见http://club.excelhome.net/thread-1382920-1-1.html
之前确实没有设置字典大小。下面是重新测试结果:
前面是VBScripit字典耗时,后面是老窖字典耗时。
1. 1万数据:0.1s,0.2s
2. 5万数据:0.3s,0.8s
3. 10万数据:0.9s,1.6s(比之前测试多0.1s)
4. 20万数据:3.4s,3,1s
4. 50万数据:23.5s,7.8s(比之前测试多0.5s)
5. 100万数据:105s,16.4s(比之前测试多1.6)
发现:设置字典大小后,速度会更慢!

TA的精华主题

TA的得分主题

 楼主| 发表于 2018-3-24 11:54 | 显示全部楼层
本帖最后由 三坛老窖 于 2018-3-24 15:23 编辑
lxw6 发表于 2018-3-24 00:54
下面是加强版字典中进行传统字典和加强版字典对比测试的语句:

特意写了存入与提取的比较测试代码,测试结果如下表: 捕获.JPG

从测试结果可以看出,使用哈希表的字典,当数据量在1万以上时,与VBScript字典相比,速度有明显的优势,在1万以下时,速度也不输给VBScript字典。

测试代码在附件中
----------------------------------------------------------

速度比较测试.rar (52.39 KB, 下载次数: 63)
----------------------------------------------------------

TA的精华主题

TA的得分主题

 楼主| 发表于 2018-3-24 12:04 | 显示全部楼层
lxw6 发表于 2018-3-24 00:54
下面是加强版字典中进行传统字典和加强版字典对比测试的语句:

你的这个测试代码有些许误差,但应该不是什么问题,而你的这个测试结果有些奇怪,各档数据量的用时与我得到的结果相差太大了!

TA的精华主题

TA的得分主题

发表于 2018-3-24 12:16 | 显示全部楼层
[广告] VBA代码宝 - VBA编程加强工具 · VBA代码随查随用  · 内置多项VBA编程加强工具       ★ 免费下载 ★      ★使用手册
三坛老窖 发表于 2018-3-24 11:54
特意写了存入与提取的比较测试代码,测试结果如下表:

从测试结果可以看出,使用哈希表的字典,当数据 ...

请问有32元的版本? 64有报错...

TA的精华主题

TA的得分主题

 楼主| 发表于 2018-3-24 20:41 | 显示全部楼层
On_fire 发表于 2018-3-24 12:16
请问有32元的版本? 64有报错...

所发布的版本都是32位的,64位的版本,因为我的电脑系统是32位的,所有没有制作64位的,你可根据32位的改写成64位的,应该不会有什么难度的。

评分

1

查看全部评分

TA的精华主题

TA的得分主题

发表于 2018-3-24 21:51 | 显示全部楼层
三坛老窖 发表于 2018-3-24 20:41
所发布的版本都是32位的,64位的版本,因为我的电脑系统是32位的,所有没有制作64位的,你可根据32位的改 ...

您能帮我看看这个问题吗?香川老师给我写的超过15条没法计算出来。http://club.excelhome.net/thread-1397290-1-1.html

TA的精华主题

TA的得分主题

发表于 2018-3-24 22:05 | 显示全部楼层
本帖最后由 On_fire 于 2018-3-24 22:11 编辑
三坛老窖 发表于 2018-3-24 20:41
所发布的版本都是32位的,64位的版本,因为我的电脑系统是32位的,所有没有制作64位的,你可根据32位的改 ...

老师,

不好意思, 其实我是小白
我试试执行, 你上传的文件, 但有报错(截图)

说甚么是要更新64位的才能用
ERROR (2).jpg

TA的精华主题

TA的得分主题

 楼主| 发表于 2018-3-24 23:14 | 显示全部楼层
On_fire 发表于 2018-3-24 22:05
老师,

不好意思, 其实我是小白

你把这个API函数改成下面的试试
Private Declare PtrSafe Function hash Lib "ntdll.dll" Alias "RtlComputeCrc32" ( _
  ByVal start As Long, ByVal data As LongPtr, ByVal size As Long) As Long
您需要登录后才可以回帖 登录 | 免费注册

本版积分规则

手机版|关于我们|联系我们|ExcelHome

GMT+8, 2024-12-23 11:16 , Processed in 0.045703 second(s), 10 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 1999-2023 Wooffice Inc.

沪公网安备 31011702000001号 沪ICP备11019229号-2

本论坛言论纯属发表者个人意见,任何违反国家相关法律的言论,本站将协助国家相关部门追究发言者责任!     本站特聘法律顾问:李志群律师

快速回复 返回顶部 返回列表