ExcelHome技术论坛

 找回密码
 免费注册

QQ登录

只需一步,快速开始

快捷登录

搜索
EH技术汇-专业的职场技能充电站 妙哉!函数段子手趣味讲函数 Excel服务器-会Excel,做管理系统 效率神器,一键搞定繁琐工作
HR薪酬管理数字化实战 Excel 2021函数公式学习大典 Excel数据透视表实战秘技 打造核心竞争力的职场宝典
让更多数据处理,一键完成 数据工作者的案头书 免费直播课集锦 ExcelHome出品 - VBA代码宝免费下载
用ChatGPT与VBA一键搞定Excel WPS表格从入门到精通 Excel VBA经典代码实践指南
查看: 941|回复: 11

[求助] 数据对比提取,量大,有好办法嘛?

[复制链接]

TA的精华主题

TA的得分主题

发表于 2023-4-3 21:38 | 显示全部楼层 |阅读模式
本帖最后由 zpwr 于 2023-4-4 17:46 编辑

想批量筛选出重复的数据,且数据量会越来越大

不知道咋办了。。。

实际数据200万+,想把红色字的词在a列对比后,留下不重复的

举例.rar (8.71 KB, 下载次数: 18)


数据举例.rar (105.79 KB, 下载次数: 1)

TA的精华主题

TA的得分主题

发表于 2023-4-4 07:59 | 显示全部楼层
[广告] VBA代码宝 - VBA编程加强工具 · VBA代码随查随用  · 内置多项VBA编程加强工具       ★ 免费下载 ★      ★使用手册
本帖最后由 liulang0808 于 2023-4-4 08:00 编辑

楼主的实际数据,一列能存放下来吗?

再建议楼主结合需求模拟下具体结果,看不懂明白

TA的精华主题

TA的得分主题

发表于 2023-4-4 08:28 | 显示全部楼层
猜一个   

数据对比提取.zip

18.6 KB, 下载次数: 11

TA的精华主题

TA的得分主题

发表于 2023-4-4 09:40 | 显示全部楼层
[广告] Excel易用宝 - 提升Excel的操作效率 · Excel / WPS表格插件       ★免费下载 ★       ★ 使用帮助
貌似是需要猜题意:
image.png
image.png

TA的精华主题

TA的得分主题

发表于 2023-4-4 10:01 | 显示全部楼层
[广告] Excel易用宝 - 提升Excel的操作效率 · Excel / WPS表格插件       ★免费下载 ★       ★ 使用帮助
源数据多的话,建议把源数据进字典。

TA的精华主题

TA的得分主题

 楼主| 发表于 2023-4-4 12:55 | 显示全部楼层
[广告] VBA代码宝 - VBA编程加强工具 · VBA代码随查随用  · 内置多项VBA编程加强工具       ★ 免费下载 ★      ★使用手册
确实表达的太差了
W3@P5}ZHMPUO)S9S0EBIUZO.png
这是别人写的,我也是这个需求

TA的精华主题

TA的得分主题

 楼主| 发表于 2023-4-4 12:57 | 显示全部楼层
W3@P5}ZHMPUO)S9S0EBIUZO.png

最终想实现这样的结果
数据会一直累加,往多了说,几千万数据吧

TA的精华主题

TA的得分主题

发表于 2023-4-4 16:14 | 显示全部楼层
[广告] Excel易用宝 - 提升Excel的操作效率 · Excel / WPS表格插件       ★免费下载 ★       ★ 使用帮助
几千万的数据,VBA都会很卡的,Python和数据库联动吧

TA的精华主题

TA的得分主题

发表于 2023-4-4 16:30 | 显示全部楼层
本帖最后由 wanghan519 于 2023-4-4 17:12 编辑

几千万行,字典去重,听起来好像是redis该干的,可以持久化,新数据可以存在文本里,遍历一次也很快
试了一下,添加100万个key用了5秒,用EXISTS判断20万新增的key是否存在用了1秒
image.png

TA的精华主题

TA的得分主题

 楼主| 发表于 2023-4-4 17:39 | 显示全部楼层
wanghan519 发表于 2023-4-4 16:30
几千万行,字典去重,听起来好像是redis该干的,可以持久化,新数据可以存在文本里,遍历一次也很快
试了 ...

方便加下好友嘛?
95134452
您需要登录后才可以回帖 登录 | 免费注册

本版积分规则

手机版|关于我们|联系我们|ExcelHome

GMT+8, 2024-9-29 08:22 , Processed in 0.033700 second(s), 9 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 1999-2023 Wooffice Inc.

沪公网安备 31011702000001号 沪ICP备11019229号-2

本论坛言论纯属发表者个人意见,任何违反国家相关法律的言论,本站将协助国家相关部门追究发言者责任!     本站特聘法律顾问:李志群律师

快速回复 返回顶部 返回列表