ExcelHome技术论坛

 找回密码
 免费注册

QQ登录

只需一步,快速开始

快捷登录

搜索
EH技术汇-专业的职场技能充电站 妙哉!函数段子手趣味讲函数 Excel服务器-会Excel,做管理系统 效率神器,一键搞定繁琐工作
HR薪酬管理数字化实战 Excel 2021函数公式学习大典 Excel数据透视表实战秘技 打造核心竞争力的职场宝典
让更多数据处理,一键完成 数据工作者的案头书 免费直播课集锦 ExcelHome出品 - VBA代码宝免费下载
用ChatGPT与VBA一键搞定Excel WPS表格从入门到精通 Excel VBA经典代码实践指南
楼主: biyupeng

[求助] 如何利用VBA将俩列一对多,多对一数据串联起来进行分组

[复制链接]

TA的精华主题

TA的得分主题

发表于 2018-6-6 14:15 | 显示全部楼层
'不输出连接一个字典就可以了,也可以不用字典但效率会差点

Option Explicit

Sub test()
  Dim i, j, arr, n, dic, first As Boolean
  Set dic = CreateObject("scripting.dictionary")
  arr = Range("a2:c" & Cells(Rows.Count, "a").End(xlUp).Row)
  For i = 2 To UBound(arr, 1): arr(i, 3) = vbNullString: Next
  For i = 1 To UBound(arr, 1)
    If Len(arr(i, 3)) = 0 Then
      first = True: dic.RemoveAll
      For j = 1 To UBound(arr, 1)
        If Len(arr(j, 3)) = 0 Then
          If first Then
            n = n + 1: first = False: arr(i, 3) = n
            dic(arr(i, 1)) = vbNullString: dic(arr(i, 2)) = vbNullString
          Else
            If dic.exists(arr(j, 1)) Or dic.exists(arr(j, 2)) Then
              arr(j, 3) = n
              dic(arr(j, 1)) = vbNullString: dic(arr(j, 2)) = vbNullString
            End If
          End If
        End If
      Next
    End If
  Next
  [a2].Resize(UBound(arr, 1), UBound(arr, 2)) = arr
End Sub

评分

1

查看全部评分

TA的精华主题

TA的得分主题

 楼主| 发表于 2018-6-6 14:29 | 显示全部楼层

TA的精华主题

TA的得分主题

 楼主| 发表于 2018-6-6 14:53 | 显示全部楼层
[广告] VBA代码宝 - VBA编程加强工具 · VBA代码随查随用  · 内置多项VBA编程加强工具       ★ 免费下载 ★      ★使用手册
一把小刀闯天下 发表于 2018-6-6 14:15
'不输出连接一个字典就可以了,也可以不用字典但效率会差点

Option Explicit

这么多IF,处理大批量的数据时候,就会卡住。

TA的精华主题

TA的得分主题

发表于 2018-6-6 15:21 | 显示全部楼层
biyupeng 发表于 2018-6-6 14:53
这么多IF,处理大批量的数据时候,就会卡住。

因为是无序的那就得2个循环,if越多速度会越快。如果组非常多可以不用字典,不停的removeall时间开销挺大。

如果A、B列有序一个循环就能搞定,就像2楼的代码。

2000条无序数据应该没有压力(4*10^6循环),5000条以上估计得假死机(2.5*10^7循环)

TA的精华主题

TA的得分主题

发表于 2018-6-6 15:49 | 显示全部楼层
biyupeng 发表于 2018-6-6 14:53
这么多IF,处理大批量的数据时候,就会卡住。

'如果组非常多就不用字典,否则速度会更慢。不假死可以在2个循环中个加入一个doevents,但速度会慢很多,好处就是你点一下它不假死机,最后弹出窗口就算结束了。
'组不多就不要修改代码,仅在相应的位置加入2个doevents就可以了。

Option Explicit

Sub test()
  Dim i, j, arr, n, dic, first As Boolean, t As String
  arr = Range("a2:c" & Cells(Rows.Count, "a").End(xlUp).Row)
  For i = 2 To UBound(arr, 1): arr(i, 3) = vbNullString: Next
  For i = 1 To UBound(arr, 1)
    If Len(arr(i, 3)) = 0 Then
      first = True: t = vbNullString
      For j = 1 To UBound(arr, 1)
        If Len(arr(j, 3)) = 0 Then
          If first Then
            n = n + 1: first = False: arr(i, 3) = n
            t = "|" & arr(i, 1) & "|" & arr(i, 2) & "|"
          Else
            If InStr(t, arr(j, 1)) > 0 Or InStr(t, arr(j, 2)) > 0 Then
              arr(j, 3) = n
              t = t & "|" & arr(j, 1) & "|" & arr(j, 2) & "|"
            End If
          End If
        End If
        DoEvents '<--
      Next
    End If
    DoEvents '<--
  Next
  [a2].Resize(UBound(arr, 1), UBound(arr, 2)) = arr
  MsgBox "ok!"
End Sub

TA的精华主题

TA的得分主题

 楼主| 发表于 2018-6-6 16:05 | 显示全部楼层
一把小刀闯天下 发表于 2018-6-6 15:49
'如果组非常多就不用字典,否则速度会更慢。不假死可以在2个循环中个加入一个doevents,但速度会慢很多, ...

一般要处理50W行的数据,大概16W组的数据。

TA的精华主题

TA的得分主题

发表于 2018-6-6 16:11 | 显示全部楼层
biyupeng 发表于 2018-6-6 16:05
一般要处理50W行的数据,大概16W组的数据。

用楼上的代码,不然removeall30万次停可怕

因为是无序的,50万行2500亿循环,,,。有序20s能搞定

TA的精华主题

TA的得分主题

发表于 2018-6-6 17:30 | 显示全部楼层
Sub 按钮1_Click()
Dim d As Object, n
Set d = CreateObject("scripting.dictionary")
ar = Range("a2:c" & [a65536].End(3).Row).Value

d(ar(1, 1)) = 1: d(ar(1, 2)) = 1
ar(1, 3) = 1: k = 1
For i = 2 To UBound(ar)
    If d.exists(ar(i, 1)) Then
        ar(i, 3) = d(ar(i, 1))
        d(ar(i, 2)) = ar(i, 3)
    ElseIf d.exists(ar(i, 2)) Then
        ar(i, 3) = d(ar(i, 2))
        d(ar(i, 1)) = ar(i, 3)
    Else
        k = k + 1
        ar(i, 3) = k
        d(ar(i, 1)) = ar(i, 3)
        d(ar(i, 2)) = ar(i, 3)
    End If
Next

[a2].Resize(UBound(ar), 3) = ar
End Sub

两列数据.zip (13.46 KB, 下载次数: 1)

评分

1

查看全部评分

TA的精华主题

TA的得分主题

 楼主| 发表于 2018-6-7 08:49 | 显示全部楼层
zopey 发表于 2018-6-6 17:30
Sub 按钮1_Click()
Dim d As Object, n
Set d = CreateObject("scripting.dictionary")

以A列排序和B列排序,得到不同的结果,这种情况可以避免吗?
1.png 2.png

TA的精华主题

TA的得分主题

发表于 2018-6-7 08:58 | 显示全部楼层
biyupeng 发表于 2018-6-7 08:49
以A列排序和B列排序,得到不同的结果,这种情况可以避免吗?

最好有实际数据及模拟结果,方便调试验证。

修改过的代码,用了2个字典对象

两列数据2.zip (14.35 KB, 下载次数: 0)
您需要登录后才可以回帖 登录 | 免费注册

本版积分规则

手机版|关于我们|联系我们|ExcelHome

GMT+8, 2024-11-22 06:51 , Processed in 0.037672 second(s), 8 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 1999-2023 Wooffice Inc.

沪公网安备 31011702000001号 沪ICP备11019229号-2

本论坛言论纯属发表者个人意见,任何违反国家相关法律的言论,本站将协助国家相关部门追究发言者责任!     本站特聘法律顾问:李志群律师

快速回复 返回顶部 返回列表