ExcelHome技术论坛

 找回密码
 免费注册

QQ登录

只需一步,快速开始

快捷登录

搜索
EH技术汇-专业的职场技能充电站 妙哉!函数段子手趣味讲函数 Excel服务器-会Excel,做管理系统 Excel Home精品图文教程库
HR薪酬管理数字化实战 Excel 2021函数公式学习大典 Excel数据透视表实战秘技 打造核心竞争力的职场宝典
300集Office 2010微视频教程 数据工作者的案头书 免费直播课集锦 ExcelHome出品 - VBA代码宝免费下载
用ChatGPT与VBA一键搞定Excel WPS表格从入门到精通 Excel VBA经典代码实践指南
查看: 12312|回复: 27

[求助] 600多M的大文件如何按要求提取所需部分数据

[复制链接]

TA的精华主题

TA的得分主题

发表于 2011-12-18 12:04 | 显示全部楼层 |阅读模式
[广告] VBA代码宝 - VBA编程加强工具 · VBA代码随查随用  · 内置多项VBA编程加强工具       ★ 免费下载 ★      ★使用手册
本帖最后由 JiuBaiYi 于 2011-12-18 12:08 编辑

有一个csv文件,达600多M,包括20列数据,200多万行。其中第一列的数据位-180~180,第二列数据为0~90,如下图所示:
shitu.jpg
现在需要提取出满足条件:第一列值(32~36),第二列值(95~100)之间的所有数据。
试着在excel里用函数来做,发现连数据都无法完全显示,函数应是无法实现的。
各位有什么好的建议吗?





该贴已经同步到 JiuBaiYi的微博

TA的精华主题

TA的得分主题

发表于 2011-12-18 12:06 | 显示全部楼层
[广告] VBA代码宝 - VBA编程加强工具 · VBA代码随查随用  · 内置多项VBA编程加强工具       ★ 免费下载 ★      ★使用手册
600M, 用ACCESS.

TA的精华主题

TA的得分主题

 楼主| 发表于 2011-12-18 12:09 | 显示全部楼层
chenzhirong 发表于 2011-12-18 12:06
600M, 用ACCESS.

VBA实现不了吗?

TA的精华主题

TA的得分主题

发表于 2011-12-18 12:12 | 显示全部楼层
[广告] Excel易用宝 - 提升Excel的操作效率 · Excel / WPS表格插件       ★免费下载 ★       ★ 使用帮助
JiuBaiYi 发表于 2011-12-18 12:09
VBA实现不了吗?

数据量太大了。。。

TA的精华主题

TA的得分主题

 楼主| 发表于 2011-12-18 12:27 | 显示全部楼层
jiminyanyan 发表于 2011-12-18 12:12
数据量太大了。。。

Access如何操作以实现呢?

TA的精华主题

TA的得分主题

发表于 2011-12-18 12:30 | 显示全部楼层
[广告] Excel易用宝 - 提升Excel的操作效率 · Excel / WPS表格插件       ★免费下载 ★       ★ 使用帮助
用ACCESS导入CSV文件, 然后按条件做个查询就OK.

TA的精华主题

TA的得分主题

发表于 2011-12-20 01:20 | 显示全部楼层

TA的精华主题

TA的得分主题

发表于 2011-12-20 01:59 | 显示全部楼层
本帖最后由 灰袍法师 于 2011-12-21 19:55 编辑

24楼用VB2010做,速度暴快,每秒35MB的吞吐量。
VBA做这种事情简直太简单了,唯一的瓶颈是硬盘速度而已,文件大小几百GB都没问题。
直接按文本文件逐行读取是最快的,肯定比什么导入数据库快得多
msconfig98的方法也不好,fso对象的效率实际上跟open然后line差不多。

要记住,VBA比Excel本身更加强大!Excel做不了的事情,VBA可以做!

楼主最好上个小附件看看,不然没法调试程序。
我自己生成一个随机文本文件,反复copy到586MB,一共一千六百多万行,肯定比你说的200多万行要慢得多
附件处理这个巨大的文本文件,并且输出筛选结果,也才耗时3分钟。 (Windows7 64bit 2.13Ghz酷睿 4GB内存 7200转硬盘)
大概是每秒3MB,一小时11GB吧

其实文件越大,每行越长,处理它的平均速度会越高,因为Windows的磁盘高速缓存会越来越有效率。
另一方面,如果是很有规律的数据,可能按二进制大段大段地读取会更快,应该可以再快1倍,当然这个方法的通用性就很差劲了。

对文本文件逐行查找并并筛选某些数据行的VBA程序.rar (10 KB, 下载次数: 430)








TA的精华主题

TA的得分主题

 楼主| 发表于 2011-12-20 08:44 | 显示全部楼层

TA的精华主题

TA的得分主题

发表于 2011-12-20 09:14 | 显示全部楼层
本帖最后由 dudebad 于 2011-12-20 09:20 编辑

用ACCESS导入CSV文件,命名为:数据库.accdb,数据库跟excel放在同一文件夹内

excel 用SQL来查询 (我用下面代码做100M的数据查询,2秒都不用,就出来了)

  1. Sub aaa()
  2. Dim cnn
  3. Dim Sql As String
  4.     Set cnn = CreateObject("ADODB.Connection")
  5.         cnn.Provider = "microsoft.ACE.oledb.12.0"
  6.         cnn.ConnectionString = "Data Source =" & ThisWorkbook.Path & "\数据库.accdb"
  7.         cnn.Open
  8.    '
  9.         Sql = "select * from[数据库] where [第一列名] between 32 and 36 and [第二列名] between 95and 100 "
  10. sheet1.Cells(2, 1).CopyFromRecordset cnn.Execute(Sql)
  11. cnn.Close
  12. Set cnn = Nothing
  13. End Sub
复制代码

您需要登录后才可以回帖 登录 | 免费注册

本版积分规则

手机版|关于我们|联系我们|ExcelHome

GMT+8, 2024-4-28 18:26 , Processed in 0.034997 second(s), 11 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 1999-2023 Wooffice Inc.

沪公网安备 31011702000001号 沪ICP备11019229号-2

本论坛言论纯属发表者个人意见,任何违反国家相关法律的言论,本站将协助国家相关部门追究发言者责任!     本站特聘法律顾问:李志群律师

快速回复 返回顶部 返回列表