ExcelHome技术论坛

 找回密码
 免费注册

QQ登录

只需一步,快速开始

快捷登录

搜索
EH技术汇-专业的职场技能充电站 妙哉!函数段子手趣味讲函数 Excel服务器-会Excel,做管理系统 效率神器,一键搞定繁琐工作
HR薪酬管理数字化实战 Excel 2021函数公式学习大典 Excel数据透视表实战秘技 打造核心竞争力的职场宝典
让更多数据处理,一键完成 数据工作者的案头书 免费直播课集锦 ExcelHome出品 - VBA代码宝免费下载
用ChatGPT与VBA一键搞定Excel WPS表格从入门到精通 Excel VBA经典代码实践指南
查看: 372|回复: 10

[求助] 海量数据处理方法的讨论

[复制链接]

TA的精华主题

TA的得分主题

发表于 2024-10-4 15:34 | 显示全部楼层 |阅读模式
本帖最后由 天地一相 于 2024-10-4 18:05 编辑

假如使用VBA处理海量数据,例如对总量(分批生成)一万亿行20列的生成数据进行查询计算处理,并获得结果。请问:有什么好的方法可以快速执行任务吗。不断优化提速的努力下(循环设计,流程优化,数据类型,等),我目前使用的是数组法与object实现类似并行计算(9开)的方法,1秒大约能处理70万行数据。很长时间来,也没能继续找到有什么更快的方法了。注意到2019直接有MultiThreadedCalculation这个并行计算功能了,还没测试使用,但貌似与我目前多开并行可能没什么速度上的差别。特此请教,若您有什么好建议,告诉一下。


PS:就在期待出现一个更好的方法的时候,脑子灵光一现,出现一个巧妙的想法,赶紧编写测试,速度提升一半多!


TA的精华主题

TA的得分主题

发表于 2024-10-4 16:14 | 显示全部楼层
[广告] Excel易用宝 - 提升Excel的操作效率 · Excel / WPS表格插件       ★免费下载 ★       ★ 使用帮助
Excel单表格最大 装载量为1048576行远远达不到你的标准,所以别在这儿提问了

评分

1

查看全部评分

TA的精华主题

TA的得分主题

 楼主| 发表于 2024-10-4 16:21 | 显示全部楼层
[广告] Excel易用宝 - 提升Excel的操作效率 · Excel / WPS表格插件       ★免费下载 ★       ★ 使用帮助
zxsea_7426 发表于 2024-10-4 16:14
Excel单表格最大 装载量为1048576行远远达不到你的标准,所以别在这儿提问了

1048576限制不了我的任务,原始数据只在内存中,结果大约只有万行左右,妥妥地可以操作。

TA的精华主题

TA的得分主题

发表于 2024-10-4 16:49 | 显示全部楼层

TA的精华主题

TA的得分主题

发表于 2024-10-4 17:51 来自手机 | 显示全部楼层
shiruiqiang 发表于 2024-10-4 16:49
应该是数据库的活了

专业的事要用专业的工具来干,我完全同意。

评分

1

查看全部评分

TA的精华主题

TA的得分主题

发表于 2024-10-5 12:41 来自手机 | 显示全部楼层
[广告] VBA代码宝 - VBA编程加强工具 · VBA代码随查随用  · 内置多项VBA编程加强工具       ★ 免费下载 ★      ★使用手册
发一份附件 我也挑战挑战 用vba

评分

1

查看全部评分

TA的精华主题

TA的得分主题

发表于 2024-10-5 13:05 | 显示全部楼层
[广告] VBA代码宝 - VBA编程加强工具 · VBA代码随查随用  · 内置多项VBA编程加强工具       ★ 免费下载 ★      ★使用手册
一亿行以上,使用数据库比较合适,或者使用Hive

评分

1

查看全部评分

TA的精华主题

TA的得分主题

发表于 2024-10-5 17:12 | 显示全部楼层
[广告] VBA代码宝 - VBA编程加强工具 · VBA代码随查随用  · 内置多项VBA编程加强工具       ★ 免费下载 ★      ★使用手册
使用DuckDB作为数据库,这个是关系型数据库、内存数据库、列式存储数据库,上亿行也就零点几秒(未建索引前提下)。有个excel duckdb的开源项目,可以参考下。我测试,仅支持64位excel。开源项目:https://github.com/bill-ash/excel-duckdb

评分

1

查看全部评分

TA的精华主题

TA的得分主题

 楼主| 发表于 2024-10-5 18:12 | 显示全部楼层
lxw6 发表于 2024-10-5 17:12
使用DuckDB作为数据库,这个是关系型数据库、内存数据库、列式存储数据库,上亿行也就零点几秒(未建索引前 ...

谢谢,我水平差搞不懂,不知道如何使用,先收藏了。

TA的精华主题

TA的得分主题

发表于 2024-10-5 21:07 | 显示全部楼层
试过5000w条,5G数据的数据处理,数据由工具上传到数据库,excel做界面,从数据库中查询结果,返回数据只有几十条,3秒以内搞定 。

评分

1

查看全部评分

您需要登录后才可以回帖 登录 | 免费注册

本版积分规则

手机版|关于我们|联系我们|ExcelHome

GMT+8, 2024-11-19 05:35 , Processed in 0.039151 second(s), 9 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 1999-2023 Wooffice Inc.

沪公网安备 31011702000001号 沪ICP备11019229号-2

本论坛言论纯属发表者个人意见,任何违反国家相关法律的言论,本站将协助国家相关部门追究发言者责任!     本站特聘法律顾问:李志群律师

快速回复 返回顶部 返回列表