ExcelHome技术论坛

 找回密码
 免费注册

QQ登录

只需一步,快速开始

快捷登录

搜索
EH技术汇-专业的职场技能充电站 妙哉!函数段子手趣味讲函数 Excel服务器-会Excel,做管理系统 Excel Home精品图文教程库
HR薪酬管理数字化实战 Excel 2021函数公式学习大典 Excel数据透视表实战秘技 打造核心竞争力的职场宝典
300集Office 2010微视频教程 数据工作者的案头书 免费直播课集锦 ExcelHome出品 - VBA代码宝免费下载
用ChatGPT与VBA一键搞定Excel WPS表格从入门到精通 Excel VBA经典代码实践指南
楼主: wodewan

[讨论] 字典和哈希表的一点小发现

[复制链接]

TA的精华主题

TA的得分主题

发表于 2021-9-17 10:43 | 显示全部楼层
大佬,我用你主楼的附件,直接点击对比测试,会显示key是空值
微信图片_20210917104204.png
微信图片_20210917104208.png

TA的精华主题

TA的得分主题

发表于 2021-9-17 10:48 | 显示全部楼层
找到读ht.Keys的方法了。
不过,这样太麻烦了,还不如Contains方法来,写入一个新数组。
image.png

评分

1

查看全部评分

TA的精华主题

TA的得分主题

发表于 2021-9-17 10:49 | 显示全部楼层
[广告] VBA代码宝 - VBA编程加强工具 · VBA代码随查随用  · 内置多项VBA编程加强工具       ★ 免费下载 ★      ★使用手册
wodewan 发表于 2021-9-17 10:38
写了一大串,还在审核,等等。。。

坐等大神的内容

TA的精华主题

TA的得分主题

 楼主| 发表于 2021-9-17 10:57 | 显示全部楼层
hellikawhi2 发表于 2021-9-17 10:43
大佬,我用你主楼的附件,直接点击对比测试,会显示key是空值

先点生成测试数据按钮,再点对比测试。

TA的精华主题

TA的得分主题

发表于 2021-9-17 11:16 | 显示全部楼层
哈希表不能装空值啊,,比如我arr是ab两列,但是两列的行数不一样,把数组装入哈希表,就会出错啊

TA的精华主题

TA的得分主题

 楼主| 发表于 2021-9-17 14:04 | 显示全部楼层
hellikawhi2 发表于 2021-9-17 11:16
哈希表不能装空值啊,,比如我arr是ab两列,但是两列的行数不一样,把数组装入哈希表,就会出错啊

是的,hashtable是不支持空键和空值的
不过就你帖子的那个问题,AB两列100多万条数据和D列60多万条数据,去重求两个的差集
https://club.excelhome.net/forum ... ;page=3#pid10782267

去空不是主要问题吧,速度才是主要问题,去空在VBA应该很好处理吧,分开取值,用个单元格的END属性,如果列数多加个循环。
在VBA中用哈希表,包括读写单元格8秒多,虽然比之前帖子里我的那个插件慢了点,但也可以接受了吧?
如果是字典你试试,看看要多久。。。

-------------------------------------------------------------------------------------------
Sub Test()
    Dim T, arr, res, i, x
    Dim Ht As IDictionary:      Set Ht = CreateObject("System.Collections.HashTable")
    Dim keys As IEnumerable:    Set keys = Ht.keys

    T = Timer

    '获取单元格数据装入哈希表
    GetHashTable Range("a2:a" & Range("A" & Cells.Rows.Count).End(3).Row).Value, Ht
    GetHashTable Range("b2:b" & Range("B" & Cells.Rows.Count).End(3).Row).Value, Ht
    arr = Range("d2:d" & Range("D" & Cells.Rows.Count).End(3).Row)


    '去除包含再D列的数据
    For Each x In arr
        If Ht.Contains(x) Then Ht.Remove (x)
    Next

    '将数据写入单元格
    ReDim res(1 To Ht.keys.Count, 1 To 1)
    i = 0
    For Each x In keys
        i = i + 1: res(i, 1) = x
    Next
    Range("G1").Resize(Ht.keys.Count, 1) = res
    MsgBox "耗时:" & Timer - T & vbNewLine & "去重求差集后数量:" & Ht.keys.Count
End Sub

Sub GetHashTable(arr, Ht) '将单元格的数据添加到哈希表
    Dim i&
    For i = 1 To UBound(arr)
        Ht(arr(i, 1)) = vbNull
    Next
End Sub




动画.gif

评分

1

查看全部评分

TA的精华主题

TA的得分主题

 楼主| 发表于 2021-9-17 14:59 | 显示全部楼层
hellikawhi2 发表于 2021-9-17 11:16
哈希表不能装空值啊,,比如我arr是ab两列,但是两列的行数不一样,把数组装入哈希表,就会出错啊

这个VBA处理起来很方便,装之前就把空的去掉,然后再装入哈希表。
或者按你的思路就在循环体里加个if(arr(i,j)<>"") then........

正好是哈希表的一个应用(包含了上面说的效率,语法,KEY的取值等等),试了下,你的那个百万数据去重求差集的问题8秒左右,代码在审核。

TA的精华主题

TA的得分主题

发表于 2021-9-17 15:22 | 显示全部楼层
[广告] Excel易用宝 - 提升Excel的操作效率 · Excel / WPS表格插件       ★免费下载 ★       ★ 使用帮助
字典最大的优势是泛型,在单线程时,读取速度快,在多线程时,效率极差!
而哈希表,在多线程时,非常棒且安全

由于VBA基本是单线程,所以还是考虑字典吧

TA的精华主题

TA的得分主题

 楼主| 发表于 2021-9-17 16:48 | 显示全部楼层
[广告] Excel易用宝 - 提升Excel的操作效率 · Excel / WPS表格插件       ★免费下载 ★       ★ 使用帮助
lsdongjh 发表于 2021-9-17 15:22
字典最大的优势是泛型,在单线程时,读取速度快,在多线程时,效率极差!
而哈希表,在多线程时,非常棒且 ...

请教一下,VBA中的字典也是泛型的吗?
泛型使用时,必须特化数据类型,VBA里怎么搞?

TA的精华主题

TA的得分主题

发表于 2021-9-17 17:01 | 显示全部楼层
wodewan 发表于 2021-9-17 14:04
是的,hashtable是不支持空键和空值的
不过就你帖子的那个问题,AB两列100多万条数据和D列60多万条数据 ...

wodewan老师您好。很想试用您的程序,但是运行时提示用户定义类型未定义的提示: 要如何定义呢?谢谢。
用户类型未定义.png



您需要登录后才可以回帖 登录 | 免费注册

本版积分规则

手机版|关于我们|联系我们|ExcelHome

GMT+8, 2024-6-3 00:57 , Processed in 0.045989 second(s), 9 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 1999-2023 Wooffice Inc.

沪公网安备 31011702000001号 沪ICP备11019229号-2

本论坛言论纯属发表者个人意见,任何违反国家相关法律的言论,本站将协助国家相关部门追究发言者责任!     本站特聘法律顾问:李志群律师

快速回复 返回顶部 返回列表