|
所有代码
import pandas as pd
import glob
dataset=pd.DataFrame()
for file in glob.glob('*.xls'):
df=pd.read_excel(file,skiprows=[1])
id=file.split('.')[0]
df.insert(0,'id',id)
dataset=pd.concat([dataset,df],ignore_index=True)
dataset['AA']=dataset['AA'].apply(lambda x: str(x)
dataset['BB']=dataset['BB'].apply(lambda x: str(x)
dataset['datetime']=dataset['AA']+'.'+dataset['BB']
grouped=dataset.groupby(dataset['datetime'])
new_dfs=[grouped.get_group(x) for x in grouped.groups]
for df in new_dfs:
file_name=df['datetime'].iloc[0]
df=df.drop(['AA','BB','datetime'],axis=1)
df=df.sort_values(by='id')
df.to_excel(file_name+'.'+'xlsx',index=False)
虽然结果是成功的,但是月份的数据只有一位,要转日期类型的需要两位,只能先分别转年、月,再转delta日期,再合并,代码里用的是string类型。 |
|