|
本帖最后由 好牛简历 于 2019-2-11 20:11 编辑
不打开excel如何从从20万份文件(200000)中批量提取手机号码在线急盼高手支持
现有200000(20万份格式不同的数据文件),需要从这20万份文件中提取手机号码
为了便于大家的帮助,专门提供示例
再把相关的情况描述出来
若是这样计算,我得干超过10年以上,都干不完
份数:200000份
分钟:5
(按最小时间来计算预估)
时间:16667(折算下来15000个小时以上)
工作日时间:6小时(咱们不可能100%全部是高效率的时间)
工作日:2278个工作日
1年220个工作日:12.62年以上的时间
*所遇到的障碍与限制
1、文件数量巨大,不太可能每1份文件都打开一一查看,通过人工的方式显然不可行
2、文件中字段,格式,不统一,无法通过SQL数据库批量操作
3、若是通过程序的方式实现提取手机号码,现有操作是通过函数操作(前提情况是打开文件),这样也不太可靠,因为文件量级太巨大,只能应用在抽查,验证上面(假设是1000个文件看1个,0.1%的比例)
为了方便大家快速处理专门处理了样本示例
请更新一下
示例样本.rar
(58.67 KB, 下载次数: 56)
|
|