ExcelHome技术论坛

 找回密码
 免费注册

QQ登录

只需一步,快速开始

快捷登录

搜索
EH技术汇-专业的职场技能充电站 妙哉!函数段子手趣味讲函数 Excel服务器-会Excel,做管理系统 效率神器,一键搞定繁琐工作
HR薪酬管理数字化实战 Excel 2021函数公式学习大典 Excel数据透视表实战秘技 打造核心竞争力的职场宝典
让更多数据处理,一键完成 数据工作者的案头书 免费直播课集锦 ExcelHome出品 - VBA代码宝免费下载
用ChatGPT与VBA一键搞定Excel WPS表格从入门到精通 Excel VBA经典代码实践指南
楼主: q8254733

[讨论] EXCEL行数装不下了怎么办?

[复制链接]

TA的精华主题

TA的得分主题

发表于 2018-7-23 16:57 | 显示全部楼层
你先在EXCEL里计算数据,要合并的时候再传入ACCESS,传入的方法有很多。

TA的精华主题

TA的得分主题

发表于 2018-7-24 08:34 | 显示全部楼层
q8254733 发表于 2018-7-23 14:14
您看我的问题有两个,一个是合并计算太大的问题,一个是存储的问题。

pandas,R是解决存储问题的吗? ...

pandas,R都可以从excel中导入导出数据,只要内存够,上亿条也没问题,计算没办法,只有重新写,不过比vba简单,毕竟专业的大数据处理工具,有大量的科学计算库支持。

TA的精华主题

TA的得分主题

发表于 2018-7-24 09:00 | 显示全部楼层
[广告] VBA代码宝 - VBA编程加强工具 · VBA代码随查随用  · 内置多项VBA编程加强工具       ★ 免费下载 ★      ★使用手册
Python的pandas库可以方便计算

TA的精华主题

TA的得分主题

发表于 2018-7-24 10:55 | 显示全部楼层
access 行没有限制,只限制单文件2G的大小。
如果你没有其它需求的话,完全可以使用ACC
建议先导入数据,然后新建查询:select * from table1,table2  即可得到你要的结果
当然如果你会VBA的话,可以直接:insert into [文件地址\文件名.accdb].[表名] select * from [文件地址\文件名.xlsx].[表1], [文件地址\文件名.xlsx].[表2]

TA的精华主题

TA的得分主题

 楼主| 发表于 2018-7-24 13:36 | 显示全部楼层
amazeyeli 发表于 2018-7-24 10:55
access 行没有限制,只限制单文件2G的大小。
如果你没有其它需求的话,完全可以使用ACC
建议先导入数据, ...

您说的很对,查询我会使用,正好您说的VBA语句我也会点。
但是我现在的问题呢,就是这个20W乘30W数据在哪里执行计算的问题,因为原始数据是在EXCEL中,我可以使用VBA在EXCEL中计算相乘,但EXCEL列又装不下这么多数据,会报错。
反而最后的保存VBA的语句倒是很简单了。

TA的精华主题

TA的得分主题

 楼主| 发表于 2018-7-24 13:37 | 显示全部楼层
[广告] VBA代码宝 - VBA编程加强工具 · VBA代码随查随用  · 内置多项VBA编程加强工具       ★ 免费下载 ★      ★使用手册
zhenghui13 发表于 2018-7-24 09:00
Python的pandas库可以方便计算

没有Python基础,能很快学会pandas库的用法吗?

TA的精华主题

TA的得分主题

发表于 2018-7-24 13:44 | 显示全部楼层
q8254733 发表于 2018-7-24 13:36
您说的很对,查询我会使用,正好您说的VBA语句我也会点。
但是我现在的问题呢,就是这个20W乘30W数据在 ...

你不会分批来计算啊?放可容纳数据的列里计算一次再换下一列再计算一次,如果有需要录入到Access里,那么又分派存进就可以了

评分

1

查看全部评分

TA的精华主题

TA的得分主题

发表于 2018-7-24 13:50 | 显示全部楼层
[广告] VBA代码宝 - VBA编程加强工具 · VBA代码随查随用  · 内置多项VBA编程加强工具       ★ 免费下载 ★      ★使用手册
q8254733 发表于 2018-7-24 13:36
您说的很对,查询我会使用,正好您说的VBA语句我也会点。
但是我现在的问题呢,就是这个20W乘30W数据在 ...

可以先导入数据库,在数据库里查询就可以了

TA的精华主题

TA的得分主题

发表于 2018-7-24 16:44 | 显示全部楼层
本帖最后由 zhenghui13 于 2018-7-24 16:51 编辑

我用Python运行了半天,只到127,产生的文件有22M。总共300132行,22M*300132/5=13205808M;=12T?
以下为Python代码
  1. #x.iterrows()函数返回一个(index, Series) pairs,存储的是这一行的下标值和这一行所有的值

  2. import datetime as dt
  3. import pandas as pd
  4. startT=dt.datetime.now()
  5. df_A=pd.read_csv('C:/Users/zhengh/Downloads/A.csv',header=None)
  6. df_A.columns=['A']
  7. df_B=pd.read_csv('C:/Users/zhengh/Downloads/B.csv',header=None)
  8. df_B.columns=['B']
  9. df=pd.DataFrame(columns=['A','B','C'])

  10. for a_index,a_row in df_A.iterrows():
  11.     for b_index,b_row in df_B.iterrows():
  12.         aData=a_row['A']
  13.         bData=b_row['B']
  14.         cData=str(aData)+"-"+bData
  15.         newData=pd.DataFrame([dict(A=str(aData),B=bData,C=cData)])
  16.         df=df.append(newData,ignore_index=True)

  17. endT=dt.datetime.now()
  18. print(endT-startT).seconds
  19. df.to_csv('C:/Users/zhengh/Downloads/df.csv',index=False,header=False)
复制代码


笛卡尔积

笛卡尔积

评分

1

查看全部评分

TA的精华主题

TA的得分主题

发表于 2018-7-24 16:56 | 显示全部楼层
zhenghui13 发表于 2018-7-24 16:44
我用Python运行了半天,只到127,产生的文件有22M。总共300132行,22M*300132/5=13205808M;=12T?
以下为Py ...

merge,how='out', 第卡尔积,全连接

评分

1

查看全部评分

您需要登录后才可以回帖 登录 | 免费注册

本版积分规则

手机版|关于我们|联系我们|ExcelHome

GMT+8, 2025-1-11 00:42 , Processed in 0.049104 second(s), 9 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 1999-2023 Wooffice Inc.

沪公网安备 31011702000001号 沪ICP备11019229号-2

本论坛言论纯属发表者个人意见,任何违反国家相关法律的言论,本站将协助国家相关部门追究发言者责任!     本站特聘法律顾问:李志群律师

快速回复 返回顶部 返回列表