ExcelHome技术论坛

 找回密码
 免费注册

QQ登录

只需一步,快速开始

快捷登录

搜索
EH技术汇-专业的职场技能充电站 妙哉!函数段子手趣味讲函数 Excel服务器-会Excel,做管理系统 Excel Home精品图文教程库
HR薪酬管理数字化实战 Excel 2021函数公式学习大典 Excel数据透视表实战秘技 打造核心竞争力的职场宝典
300集Office 2010微视频教程 数据工作者的案头书 免费直播课集锦 ExcelHome出品 - VBA代码宝免费下载
用ChatGPT与VBA一键搞定Excel WPS表格从入门到精通 Excel VBA经典代码实践指南
楼主: lhj323323

[已解决] 提速,提取4000多个txt,耗时56.39秒,谢谢prome3、wanghan519、lxdexcel等诸位老师!

[复制链接]

TA的精华主题

TA的得分主题

发表于 2024-2-10 20:08 | 显示全部楼层
lhj323323 发表于 2024-2-10 19:36
谢谢老师指点

用什么来执行批处理?

需要去github下载ripgrep那个rg.exe,放到环境变量PATH里,然后大概这样,很多地方没考虑细节


批注 2024-02-10 200829.jpg

评分

1

查看全部评分

TA的精华主题

TA的得分主题

发表于 2024-2-10 20:38 | 显示全部楼层
[广告] Excel易用宝 - 提升Excel的操作效率 · Excel / WPS表格插件       ★免费下载 ★       ★ 使用帮助
wanghan519 发表于 2024-2-10 20:08
需要去github下载ripgrep那个rg.exe,放到环境变量PATH里,然后大概这样,很多地方没考虑细节

学习了。。。

TA的精华主题

TA的得分主题

发表于 2024-2-10 21:00 | 显示全部楼层
本帖最后由 ykcbf1100 于 2024-2-10 21:04 编辑

我找到一种方法,就是OpenTextFile法,速度还行,你可以参考一下。

速度.7z

1.21 MB, 下载次数: 12

评分

1

查看全部评分

TA的精华主题

TA的得分主题

发表于 2024-2-10 22:22 | 显示全部楼层
ykcbf1100 发表于 2024-2-10 18:05
我用Workbooks.Open试了一下,发现速度比你自己的要慢得多,我这里要10多秒,而你的代码在我这里只要0.06秒 ...

我这边运行他的代码也只需要0.07秒。

TA的精华主题

TA的得分主题

发表于 2024-2-11 00:20 | 显示全部楼层
我测试了一下,平台为Microsoft 1866平板,内在16G。只开浏览器和EXCEL2021的情况下,导入你提供的文件包用时为0.136秋。

TA的精华主题

TA的得分主题

发表于 2024-2-11 00:25 | 显示全部楼层
看一楼截图,总文件大小 5.28 GB……文件数量众多,平均一个文件大小在 1 MB,估计代码的运行时间大部分都在文件读写上了。
为了尽可能模拟原始数据体量,我复制了一楼附件中最大的文本文件5000次,得到的总文件大小如下:
总文件大小.png
运行结果如下:
运行时间Win10_Excel2019.png

通过观察一楼的文本文件,我发现最近一天的数据都是从上午九点半到十一点半,下午一点到三点,共4个小时,每隔1分钟产生一条记录(一个文本行),总共240行;每行共8列,由7个制表符分开。我写的代码是根据这些观察结果来的,至于原始数据具体(确定的是)啥格式,估计只有生成原始数据的人知道了。

从代码运行速度的角度看,貌似我的代码达到了本贴的提速的目标。但我依旧十分怀疑是楼主电脑太慢了:)

速度.zip

48.06 KB, 下载次数: 5

TA的精华主题

TA的得分主题

发表于 2024-2-11 07:43 | 显示全部楼层

TA的精华主题

TA的得分主题

 楼主| 发表于 2024-2-11 09:02 | 显示全部楼层
[广告] Excel易用宝 - 提升Excel的操作效率 · Excel / WPS表格插件       ★免费下载 ★       ★ 使用帮助

谢谢老师!

我把您写的如下这一段
  1. For y = UBound(ar) - 2 To 1 Step -1 '倒着判断,这样速度可能有所提升,以下为猜测
  2.      If Left(ar(y), 10) > Left(ar(y - 1), 10) Then '比上面的split 快点
  3.          br = Split(ar(y), vbTab)
  4.          For j = 0 To UBound(br)
  5.               vResult(r, j) = br(j)
复制代码
改为,定位提取
  1. 'For y = UBound(ar) - 2 To 1 Step -1 '倒着判断,这样速度可能有所提升,以下为猜测
  2.       y = UBound(ar) - 240 - 1 '我用这一句,代替For...Next y
  3.       If Left(ar(y), 10) > Left(ar(y - 1), 10) Then '比上面的split 快点
  4.          br = Split(ar(y), vbTab)
复制代码
提取4415个txt,耗时由76秒( 历遍提取),改成提升到58秒(定位提取)

TA的精华主题

TA的得分主题

发表于 2024-2-11 09:07 | 显示全部楼层
供参考...集算器解法...4510个文件可以跑进7秒电脑配置4C16G,利用4线程并行。

截屏2024-02-11 09.02.13.png

TA的精华主题

TA的得分主题

 楼主| 发表于 2024-2-11 09:24 | 显示全部楼层
ykcbf1100 发表于 2024-2-10 21:00
我找到一种方法,就是OpenTextFile法,速度还行,你可以参考一下。

13楼的代码,比不了你之前提供的源码
4415个txt,耗时167秒
您需要登录后才可以回帖 登录 | 免费注册

本版积分规则

手机版|关于我们|联系我们|ExcelHome

GMT+8, 2024-5-29 18:19 , Processed in 0.044359 second(s), 10 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 1999-2023 Wooffice Inc.

沪公网安备 31011702000001号 沪ICP备11019229号-2

本论坛言论纯属发表者个人意见,任何违反国家相关法律的言论,本站将协助国家相关部门追究发言者责任!     本站特聘法律顾问:李志群律师

快速回复 返回顶部 返回列表