ExcelHome技术论坛

 找回密码
 免费注册

QQ登录

只需一步,快速开始

快捷登录

搜索
EH技术汇-专业的职场技能充电站 妙哉!函数段子手趣味讲函数 Excel服务器-会Excel,做管理系统 Excel Home精品图文教程库
HR薪酬管理数字化实战 Excel 2021函数公式学习大典 Excel数据透视表实战秘技 打造核心竞争力的职场宝典
300集Office 2010微视频教程 数据工作者的案头书 免费直播课集锦 ExcelHome出品 - VBA代码宝免费下载
用ChatGPT与VBA一键搞定Excel WPS表格从入门到精通 Excel VBA经典代码实践指南
楼主: 好牛简历

[求助] 不打开excel如何从从20万份文件(200000)中批量提取手机号码在线急盼高手支持

[复制链接]

TA的精华主题

TA的得分主题

发表于 2019-2-11 17:36 | 显示全部楼层
[广告] Excel易用宝 - 提升Excel的操作效率 · Excel / WPS表格插件       ★免费下载 ★       ★ 使用帮助
好牛简历 发表于 2019-2-11 17:29
20万份文件,示例只是当中一个情况
而格式,字段,都不一统一哇
在这样的情况下

楼主都有思路了,就按照自己的既定思路处理吧
下图代码是根据楼主提供的附件提取的结果,将楼主csv文件跟代码文件放到一个文件夹里进行遍历处理。
QQ截图20190211173431.jpg

评分

1

查看全部评分

TA的精华主题

TA的得分主题

 楼主| 发表于 2019-2-11 17:44 | 显示全部楼层
[广告] Excel易用宝 - 提升Excel的操作效率 · Excel / WPS表格插件       ★免费下载 ★       ★ 使用帮助
liulang0808 发表于 2019-2-11 17:36
楼主都有思路了,就按照自己的既定思路处理吧
下图代码是根据楼主提供的附件提取的结果,将楼主csv文件 ...

我还想请教一下
1,表格文件本身(有大,有小)
如有300MB的,3MB,500MB的
这样在处理的时候,本身有没限制?或者分步,分批来处理?
2,提取手机号码,您用的函数是?

TA的精华主题

TA的得分主题

发表于 2019-2-11 17:47 | 显示全部楼层
好牛简历 发表于 2019-2-11 17:44
我还想请教一下
1,表格文件本身(有大,有小)
如有300MB的,3MB,500MB的

提取手机号码,目前代码中使用的是正则表达式
也可以用其他方式,具体看自己的喜好跟方便程度。

关于其他问题,楼主都有自己的思路,完全可以按照自己的思路去处理看看的。
实践出真知。光想不练,没有用的。

TA的精华主题

TA的得分主题

发表于 2019-2-11 18:02 | 显示全部楼层
1、历遍文件
2、sql读取资料到数组
3、对数组每个资料进行正则提取手机

TA的精华主题

TA的得分主题

 楼主| 发表于 2019-2-11 18:05 | 显示全部楼层
liulang0808 发表于 2019-2-11 17:47
提取手机号码,目前代码中使用的是正则表达式
也可以用其他方式,具体看自己的喜好跟方便程度。

能提出问题,往往比解决问题更艰难
因为能把问题阐述清爽,抓住要害,并且简化为操作步骤
这是人类认知的巨大进步


诚如您有偿QQ:1302084032每个人的优势,专长,完全不一样
而您能有耐心,咱们也能提供更好的方式,以供您也有价值,如此良性循环
Excel有偿总结.png
Excel有偿总结2.png
Excel有偿总结20190211.rar (7.86 KB, 下载次数: 11)

^V^



TA的精华主题

TA的得分主题

 楼主| 发表于 2019-2-11 18:06 | 显示全部楼层
microyip 发表于 2019-2-11 18:02
1、历遍文件
2、sql读取资料到数组
3、对数组每个资料进行正则提取手机

3步走
1、历遍文件【可行】
2、sql读取资料到数组【这个不可行,因为文件格式杂乱,不统一】SQL是有限制的
3、对数组每个资料进行正则提取手机【这个可行】【若是第2步,受到限制,这样的情况你能模拟出来么?】
非常乐意聆听,以及看到你能回到问题本身,模拟出来这样的情况
^V^

TA的精华主题

TA的得分主题

发表于 2019-2-11 18:08 | 显示全部楼层
[广告] Excel易用宝 - 提升Excel的操作效率 · Excel / WPS表格插件       ★免费下载 ★       ★ 使用帮助
什么叫文件格式杂乱先?反正示例里的数据很整齐啊,就一列资料

TA的精华主题

TA的得分主题

 楼主| 发表于 2019-2-11 18:12 | 显示全部楼层
本帖最后由 好牛简历 于 2019-2-11 18:20 编辑
microyip 发表于 2019-2-11 18:08
什么叫文件格式杂乱先?反正示例里的数据很整齐啊,就一列资料


什么叫文件格式杂乱先?
20000份文件,我只上传了一个示例
包括如下的两层“杂乱”

文件格式
1,表格有不同的格式
A,EXCEL的格式 (xls,xlsx)
B,CSV
C,MDB
D,txt
E,甚至还有doc
....N种文件格式

2,就是表格本身
每个表格的字段内容不统一,有不同的行,列,以及取名,命名方式

TA的精华主题

TA的得分主题

发表于 2019-2-11 18:23 | 显示全部楼层
[广告] VBA代码宝 - VBA编程加强工具 · VBA代码随查随用  · 内置多项VBA编程加强工具       ★ 免费下载 ★      ★使用手册
ABC可以直接用SQL读,D应该要分别打开读取成一个字符串,
E应该要分别打开,分段落读取字符串处理。
应该不是问题啊

TA的精华主题

TA的得分主题

 楼主| 发表于 2019-2-11 18:27 | 显示全部楼层
[广告] Excel易用宝 - 提升Excel的操作效率 · Excel / WPS表格插件       ★免费下载 ★       ★ 使用帮助
microyip 发表于 2019-2-11 18:23
ABC可以直接用SQL读,D应该要分别打开读取成一个字符串,
E应该要分别打开,分段落读取字符串处理。
应该 ...


ABC可以直接用SQL读【还有限制障碍与条件】
1,字段格式并不统一,试问这样的情况下,就算是SQL用得再强大,也有力使不出来
能意识到客观的情况么?
2,所有的文件,当下只专注于提取出来【手机号码】
***而做数据清洗,这个是系统工程,在规范字段之后,SQL才能发挥价值***
您需要登录后才可以回帖 登录 | 免费注册

本版积分规则

手机版|关于我们|联系我们|ExcelHome

GMT+8, 2024-5-14 04:24 , Processed in 0.045840 second(s), 12 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 1999-2023 Wooffice Inc.

沪公网安备 31011702000001号 沪ICP备11019229号-2

本论坛言论纯属发表者个人意见,任何违反国家相关法律的言论,本站将协助国家相关部门追究发言者责任!     本站特聘法律顾问:李志群律师

快速回复 返回顶部 返回列表