ExcelHome技术论坛

 找回密码
 免费注册

QQ登录

只需一步,快速开始

快捷登录

搜索
EH技术汇-专业的职场技能充电站 妙哉!函数段子手趣味讲函数 Excel服务器-会Excel,做管理系统 效率神器,一键搞定繁琐工作
HR薪酬管理数字化实战 Excel 2021函数公式学习大典 Excel数据透视表实战秘技 打造核心竞争力的职场宝典
让更多数据处理,一键完成 数据工作者的案头书 免费直播课集锦 ExcelHome出品 - VBA代码宝免费下载
用ChatGPT与VBA一键搞定Excel WPS表格从入门到精通 Excel VBA经典代码实践指南
楼主: lhj323323

[已解决] 提速,提取4000多个txt,耗时56.39秒,谢谢prome3、wanghan519、lxdexcel等诸位老师!

[复制链接]

TA的精华主题

TA的得分主题

 楼主| 发表于 2024-2-13 22:23 | 显示全部楼层
prome3 发表于 2024-2-13 21:58
这个着实很快!刚刚我试了一下,4042 个文件,5.30 GB 总大小,只需要 0.5 秒!而且结果都是正确的。相比 ...

老师,您的代码,也很不错了,跨过了10秒大关。

TA的精华主题

TA的得分主题

 楼主| 发表于 2024-2-13 22:25 | 显示全部楼层
[广告] Excel易用宝 - 提升Excel的操作效率 · Excel / WPS表格插件       ★免费下载 ★       ★ 使用帮助
prome3 发表于 2024-2-11 00:25
看一楼截图,总文件大小 5.28 GB……文件数量众多,平均一个文件大小在 1 MB,估计代码的运行时间大部分都 ...

老师

原始数据的格式,即是一楼上传的格式,我未作改动。

TA的精华主题

TA的得分主题

 楼主| 发表于 2024-2-13 22:28 | 显示全部楼层
prome3 发表于 2024-2-13 21:58
这个着实很快!刚刚我试了一下,4042 个文件,5.30 GB 总大小,只需要 0.5 秒!而且结果都是正确的。相比 ...

这个论坛,藏龙卧虎,了不得。

TA的精华主题

TA的得分主题

 楼主| 发表于 2024-2-14 10:33 | 显示全部楼层
[广告] Excel易用宝 - 提升Excel的操作效率 · Excel / WPS表格插件       ★免费下载 ★       ★ 使用帮助
wanghan519 发表于 2024-2-13 13:22
调用cmd的方式多少有点怪
只是速度令人满意

老师:

我想把提取的日期参数化,如下图

快照9.png

同步修改语句
   Dim  dd$
快照7.png

运行后,如下句,会报错
快照8.png

TA的精华主题

TA的得分主题

发表于 2024-2-14 11:16 | 显示全部楼层
lhj323323 发表于 2024-2-14 10:33
老师:

我想把提取的日期参数化,如下图
  1.     Dim dd$
  2.     dd = Format(Range("M13").Value, "yyyy/mm/dd")
  3.     Command = "cmd /c cls && """ & ThisWorkbook.Path & "\rg.exe"" -g ""*.txt"" ""^" & dd & """ -m1 """ & ThisWorkbook.Path & """"
复制代码

月、日需要补0,format就是把2024/2/6变成2024/02/06
因为rg只是个从文件中搜正则的工具,它不认识日期类型,只认字符串,所以要找的字符串必须一致

用seek直接把光标跳到最后300行左右,真的快,更适合这题,我也学到一招
rg则适用于随便搜点什么,速度都还能接受


评分

1

查看全部评分

TA的精华主题

TA的得分主题

发表于 2024-2-14 11:17 | 显示全部楼层
lhj323323 发表于 2024-2-14 10:33
老师:

我想把提取的日期参数化,如下图

下标越界是说没搜到结果,所以split前应该加一句判断,避免在没搜到结果时报错

TA的精华主题

TA的得分主题

 楼主| 发表于 2024-2-14 12:19 | 显示全部楼层
[广告] Excel易用宝 - 提升Excel的操作效率 · Excel / WPS表格插件       ★免费下载 ★       ★ 使用帮助
本帖最后由 lhj323323 于 2024-2-14 12:21 编辑
wanghan519 发表于 2024-2-14 11:17
下标越界是说没搜到结果,所以split前应该加一句判断,避免在没搜到结果时报错

谢谢老师!
动态日期搞定了。
原句
  1. Command = "cmd /c cls && """ & ThisWorkbook.Path & "\rg.exe"" -g ""S*.txt"" ""^2024/02/08"" -m1 """ & ThisWorkbook.Path & """"
复制代码



如果,我把N个txt放在同路径的子文件夹【数据源】里,路径里,没有空格
则下面的写法,运行后
原文件名【SH#600000.txt】
   就变成【鏁版嵁婧怽SH#600000.txt】
感觉,这段代码,提取的是镜像,路径中的汉字,是不能在这个环节里添加的。
  1. Dim mypath$
  2. ' mypath = ThisWorkbook.Path '同路径提取ok,注意,这里不能加斜杠
  3. mypath = ThisWorkbook.Path & "\数据源"
  4. Command = "cmd /c cls && """ & mypath & "\rg.exe"" -g ""S*.txt"" ""^2024/02/08"" -m1 """ & mypath & """"
复制代码


TA的精华主题

TA的得分主题

发表于 2024-2-14 12:51 | 显示全部楼层
lhj323323 发表于 2024-2-14 12:19
谢谢老师!
动态日期搞定了。
原句

乱码是因为cmd命令输出的是utf8,而vba里当成了gbk解析,可以用vba里的adostream转码,也可以在命令里加上iconv转码

所以这是个取舍

之所以用rg这种命令行工具,一是rg多线程,二是rg算法和楼上大佬的差不多,都是一大段内容匹配,而不是逐行,再有一些算法优化,所以比较快,主要是还不用动脑。。。
但用cmd命令行总会带来各种问题,中文乱码,双引号地狱等等

批注 2024-02-14 124638.jpg

TA的精华主题

TA的得分主题

发表于 2024-2-14 13:15 | 显示全部楼层
lhj323323 发表于 2024-2-14 12:19
谢谢老师!
动态日期搞定了。
原句

审核了。。。因为批处理输出的是utf8的中文,可以用这段,把中文文件名那一列改正确
图片.png

评分

1

查看全部评分

TA的精华主题

TA的得分主题

 楼主| 发表于 2024-2-14 17:13 | 显示全部楼层
wanghan519 发表于 2024-2-14 13:15
审核了。。。因为批处理输出的是utf8的中文,可以用这段,把中文文件名那一列改正确

谢谢老师!
终于搞定了,UTF-8的乱码问题。

再次感谢!!!
您需要登录后才可以回帖 登录 | 免费注册

本版积分规则

手机版|关于我们|联系我们|ExcelHome

GMT+8, 2024-11-18 21:40 , Processed in 0.042774 second(s), 8 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 1999-2023 Wooffice Inc.

沪公网安备 31011702000001号 沪ICP备11019229号-2

本论坛言论纯属发表者个人意见,任何违反国家相关法律的言论,本站将协助国家相关部门追究发言者责任!     本站特聘法律顾问:李志群律师

快速回复 返回顶部 返回列表