ExcelHome技术论坛

 找回密码
 免费注册

QQ登录

只需一步,快速开始

快捷登录

搜索
EH技术汇-专业的职场技能充电站 妙哉!函数段子手趣味讲函数 Excel服务器-会Excel,做管理系统 效率神器,一键搞定繁琐工作
HR薪酬管理数字化实战 Excel 2021函数公式学习大典 Excel数据透视表实战秘技 打造核心竞争力的职场宝典
让更多数据处理,一键完成 数据工作者的案头书 免费直播课集锦 ExcelHome出品 - VBA代码宝免费下载
用ChatGPT与VBA一键搞定Excel WPS表格从入门到精通 Excel VBA经典代码实践指南
查看: 3328|回复: 10

[求助] 逐文件逐行的数据提取

[复制链接]

TA的精华主题

TA的得分主题

发表于 2018-7-18 22:21 | 显示全部楼层 |阅读模式
有这样一组表格文件,每个表格文件内有多年逐日数据,共20余个表格文件。我的想法是将每个文件内同一天的数据放在一个新表格文件中,新文件文件名为日期(日期根据原文件 第一列、第二列得到)。亦即最后会成为上万个表格文件,每个文件内20行,文件中第一列能够指示此行数据出自某个文件。

简单说就是把按名字排列的逐日数据变为按日排列数据,把二十多个上万行的表格文件变成上万个二十多行的表格文件。

附件是我手动做出来的一个示例,大概就是这个样子。

不知能否实现。 谢谢各位大佬

示例.zip

83.73 KB, 下载次数: 16

TA的精华主题

TA的得分主题

发表于 2018-7-19 06:31 | 显示全部楼层
本帖最后由 sheeboard 于 2018-7-19 07:25 编辑

问一下,AA代表年,BB代表月.FF,GG,HH代表什么?
import pandas as pd
import glob

dataset=pd.DataFrame()

for file in glob.glob('*.xls'):
    ...:     df=pd.read_excel(file,skiprows=[1])
    ...:     id=file.split('.')[0]
    ...:     df.insert(0,'id',id)
    ...:     dataset=pd.concat([dataset,df],ignore_index=True)


试了试部分代码,后面是生成时间序列然后分组,再保存。

TA的精华主题

TA的得分主题

 楼主| 发表于 2018-7-19 09:46 | 显示全部楼层
本帖最后由 enna001 于 2018-7-19 09:48 编辑
sheeboard 发表于 2018-7-19 06:31
问一下,AA代表年,BB代表月.FF,GG,HH代表什么?
import pandas as pd
import glob

嗯嗯,那些都是一些名词我就用这个字母代替了。在处理过程中 FF,GG,HH 可以删除。谢谢

TA的精华主题

TA的得分主题

发表于 2018-7-19 09:58 | 显示全部楼层
所有代码
import pandas as pd
import glob

dataset=pd.DataFrame()

for file in glob.glob('*.xls'):
    df=pd.read_excel(file,skiprows=[1])
    id=file.split('.')[0]
    df.insert(0,'id',id)
    dataset=pd.concat([dataset,df],ignore_index=True)

dataset['AA']=dataset['AA'].apply(lambda x: str(x)
dataset['BB']=dataset['BB'].apply(lambda x: str(x)
dataset['datetime']=dataset['AA']+'.'+dataset['BB']

grouped=dataset.groupby(dataset['datetime'])

new_dfs=[grouped.get_group(x) for x in grouped.groups]

for df in new_dfs:
    file_name=df['datetime'].iloc[0]
    df=df.drop(['AA','BB','datetime'],axis=1)
    df=df.sort_values(by='id')
    df.to_excel(file_name+'.'+'xlsx',index=False)

虽然结果是成功的,但是月份的数据只有一位,要转日期类型的需要两位,只能先分别转年、月,再转delta日期,再合并,代码里用的是string类型。

TA的精华主题

TA的得分主题

发表于 2018-7-19 10:00 | 显示全部楼层

TA的精华主题

TA的得分主题

发表于 2018-7-19 10:06 | 显示全部楼层
[广告] VBA代码宝 - VBA编程加强工具 · VBA代码随查随用  · 内置多项VBA编程加强工具       ★ 免费下载 ★      ★使用手册
代码,如果数据非常大的话可以考虑用数据库。

Screenshot from 2018-07-19 10-04-53.png

TA的精华主题

TA的得分主题

发表于 2018-7-19 10:19 | 显示全部楼层
头像被屏蔽

TA的精华主题

TA的得分主题

发表于 2018-7-19 10:21 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽

TA的精华主题

TA的得分主题

 楼主| 发表于 2018-7-19 10:22 | 显示全部楼层
sheeboard 发表于 2018-7-19 10:06
代码,如果数据非常大的话可以考虑用数据库。

嗯嗯  非常感谢  我去试试

TA的精华主题

TA的得分主题

 楼主| 发表于 2018-7-19 10:24 | 显示全部楼层
opiona 发表于 2018-7-19 10:19
拆分见69楼: http://club.excelhome.net/thread-1409141-1-1.html

好的  谢谢老师 我去看看
您需要登录后才可以回帖 登录 | 免费注册

本版积分规则

手机版|关于我们|联系我们|ExcelHome

GMT+8, 2025-1-10 11:34 , Processed in 0.053091 second(s), 10 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 1999-2023 Wooffice Inc.

沪公网安备 31011702000001号 沪ICP备11019229号-2

本论坛言论纯属发表者个人意见,任何违反国家相关法律的言论,本站将协助国家相关部门追究发言者责任!     本站特聘法律顾问:李志群律师

快速回复 返回顶部 返回列表