ExcelHome技术论坛

 找回密码
 免费注册

QQ登录

只需一步,快速开始

EH搜索     
EH云课堂-专业的职场技能充电站 Excel转在线管理系统,怎么做看这里 Excel服务器-会Excel,做管理系统 Excel Home精品图文教程库
Excel不给力? 何不试试FoxTable! Excel 2016函数公式学习大典 EH云课堂直播课程免费学 打造核心竞争力的职场宝典
300集Office 2010微视频教程 Tableau-数据可视化工具 精品推荐-800套精选PPT模板,点击获取 ExcelHome出品 - VBA代码宝免费下载
你的Excel 2010实战技巧学习锦囊 欲罢不能, 过目难忘的 Office 新界面 Excel VBA经典代码实践指南
楼主: 好牛简历

[求助] 不打开excel如何从从20万份文件(200000)中批量提取手机号码在线急盼高手支持

[复制链接]

TA的精华主题

TA的得分主题

发表于 2019-2-11 18:31 | 显示全部楼层
好牛简历 发表于 2019-2-11 18:27
ABC可以直接用SQL读【还有限制障碍与条件】
1,字段格式并不统一,试问这样的情况下,就算是SQL用得再 ...

这个就说明你对SQL的理解或应用存在歧义了,尤其是第三步就是为了处理第二步产生问题的

评分

参与人数 1鲜花 +2 收起 理由
好牛简历 + 2 太强大了

查看全部评分

TA的精华主题

TA的得分主题

 楼主| 发表于 2019-2-11 18:34 | 显示全部楼层
microyip 发表于 2019-2-11 18:31
这个就说明你对SQL的理解或应用存在歧义了,尤其是第三步就是为了处理第二步产生问题的

这样,你看成么
根据指定字段,汇总工作簿
http://club.excelhome.net/thread-1460316-1-1.html
(出处: ExcelHome技术论坛)

就着前面这个问题,格式(甚至表头都有多行)不统一的
若是应用SQL,我想看看你的操作,咱们可以达成共识,看能否消除歧义
非常感谢你的耐心
^V^期待你的处理成果与大作

TA的精华主题

TA的得分主题

发表于 2019-2-11 18:51 | 显示全部楼层
弱弱的学习一下:遍历文件,提取文件内工作表中的单元格的内容,是不是即使用代码也需要把文件打开关闭一次??
如果是这样,那么20万个文件,即使最简单的提取,是不是也要花非常多的时间,因为一开一关就算1秒,都要20万秒?

TA的精华主题

TA的得分主题

 楼主| 发表于 2019-2-11 19:28 | 显示全部楼层
micch 发表于 2019-2-11 18:51
弱弱的学习一下:遍历文件,提取文件内工作表中的单元格的内容,是不是即使用代码也需要把文件打开关闭一次 ...

将近1周的时间 7天就没了
秒                分钟                小时               
200000        60        3333.333333        60        55.55555556        8        6.944444444




TA的精华主题

TA的得分主题

发表于 2019-2-11 19:30 来自手机 | 显示全部楼层
兄弟,说这么多是站在你的视角得出的结论,你不如多发几个示例文件上来,让大家看看有没有好的方法方案。

TA的精华主题

TA的得分主题

 楼主| 发表于 2019-2-11 19:38 | 显示全部楼层
本帖最后由 好牛简历 于 2019-2-11 19:46 编辑
2489586288 发表于 2019-2-11 19:30
兄弟,说这么多是站在你的视角得出的结论,你不如多发几个示例文件上来,让大家看看有没有好的方法方案。

给力,这就来
我把示例,再打个包,小等我一会
30-60分钟左右【样本啥的,我还要挑一下】
^V^

TA的精华主题

TA的得分主题

 楼主| 发表于 2019-2-11 20:12 | 显示全部楼层
liulang0808 发表于 2019-2-11 17:21
楼主就是提取手机号码呗,并且仅仅第一列有数据呗?
没有具体模拟结果,附件里也仅仅一个文件啊

刚更新了多个文件示例
^V^
非常感谢耐心指点

TA的精华主题

TA的得分主题

 楼主| 发表于 2019-2-11 20:13 | 显示全部楼层
2489586288 发表于 2019-2-11 19:30
兄弟,说这么多是站在你的视角得出的结论,你不如多发几个示例文件上来,让大家看看有没有好的方法方案。

刚更新了多个文件示例
^V^
非常感谢耐心指点

TA的精华主题

TA的得分主题

发表于 2019-2-11 20:34 | 显示全部楼层
好牛简历 发表于 2019-2-11 19:28
将近1周的时间 7天就没了
秒                分钟                小时               
200000        60        3333.333333        60        55.55555556        8        6.944444444

再弱弱的问下一:是不是这就算大数据处理了?先不说代码优化的问题,相同代码情况下,是不是超级计算机就能很快处理完,而PC就要花费7天时间???

TA的精华主题

TA的得分主题

 楼主| 发表于 2019-2-11 20:36 | 显示全部楼层
micch 发表于 2019-2-11 20:34
再弱弱的问下一:是不是这就算大数据处理了?先不说代码优化的问题,相同代码情况下,是不是超级计算机就 ...

这两者并不等价哇
为啥?
因为数据在这样的状态之下,是无意义的
需要【数据清洗】之后,才有价值
而这个阶段,需要消耗80%的时间与精力
您需要登录后才可以回帖 登录 | 免费注册

本版积分规则

关注官方微信,每天学会一个新技能

手机版|关于我们|联系我们|ExcelHome

GMT+8, 2019-10-18 05:01 , Processed in 0.066107 second(s), 10 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 1999-2020 Wooffice Inc.

   

沪公网安备 31011702000001号 沪ICP备11019229号

本论坛言论纯属发表者个人意见,任何违反国家相关法律的言论,本站将协助国家相关部门追究发言者责任!     本站特聘法律顾问:徐怀玉律师 李志群律师

快速回复 返回顶部 返回列表