|
本帖最后由 zhenghui13 于 2018-7-24 16:51 编辑
我用Python运行了半天,只到127,产生的文件有22M。总共300132行,22M*300132/5=13205808M;=12T?
以下为Python代码
- #x.iterrows()函数返回一个(index, Series) pairs,存储的是这一行的下标值和这一行所有的值
- import datetime as dt
- import pandas as pd
- startT=dt.datetime.now()
- df_A=pd.read_csv('C:/Users/zhengh/Downloads/A.csv',header=None)
- df_A.columns=['A']
- df_B=pd.read_csv('C:/Users/zhengh/Downloads/B.csv',header=None)
- df_B.columns=['B']
- df=pd.DataFrame(columns=['A','B','C'])
- for a_index,a_row in df_A.iterrows():
- for b_index,b_row in df_B.iterrows():
- aData=a_row['A']
- bData=b_row['B']
- cData=str(aData)+"-"+bData
- newData=pd.DataFrame([dict(A=str(aData),B=bData,C=cData)])
- df=df.append(newData,ignore_index=True)
- endT=dt.datetime.now()
- print(endT-startT).seconds
- df.to_csv('C:/Users/zhengh/Downloads/df.csv',index=False,header=False)
复制代码
|
-
笛卡尔积
评分
-
1
查看全部评分
-
|