ExcelHome技术论坛

 找回密码
 免费注册

QQ登录

只需一步,快速开始

快捷登录

搜索
EH技术汇-专业的职场技能充电站 妙哉!函数段子手趣味讲函数 Excel服务器-会Excel,做管理系统 效率神器,一键搞定繁琐工作
HR薪酬管理数字化实战 Excel 2021函数公式学习大典 Excel数据透视表实战秘技 打造核心竞争力的职场宝典
让更多数据处理,一键完成 数据工作者的案头书 免费直播课集锦 ExcelHome出品 - VBA代码宝免费下载
用ChatGPT与VBA一键搞定Excel WPS表格从入门到精通 Excel VBA经典代码实践指南
查看: 6449|回复: 13

[求助] 超200万行数据拆分!求助!

[复制链接]

TA的精华主题

TA的得分主题

发表于 2018-7-24 15:26 | 显示全部楼层 |阅读模式
[广告] VBA代码宝 - VBA编程加强工具 · VBA代码随查随用  · 内置多项VBA编程加强工具       ★ 免费下载 ★      ★使用手册
老师们好!我手头有份数据(csv格式),超过230万行,一共11列数据(A-K)。excel限制,打不开全部文件,想要拆分成24*10万行的工作表,请老师们指导!如下图,一共230万行。

数据样式

数据样式

TA的精华主题

TA的得分主题

 楼主| 发表于 2018-7-24 15:30 | 显示全部楼层
[广告] VBA代码宝 - VBA编程加强工具 · VBA代码随查随用  · 内置多项VBA编程加强工具       ★ 免费下载 ★      ★使用手册
求大佬指导!

TA的精华主题

TA的得分主题

发表于 2018-7-24 15:58 | 显示全部楼层

'会有假死机现象,可以在do...loop中加入doevents

Option Explicit

Const NUM = 10 ^ 5

Sub test()
  Dim i, j, t, n, filename, m
  ReDim arr(1 To NUM, 1 To 11)
  Application.ScreenUpdating = False
  Cells.ClearContents
  filename = "d:\abc.csv" '文件位置,自己修改
  Open filename For Input As #1
  Do While Not EOF(1)
    Line Input #1, t
    If InStr(t, ",") Then
      t = Split(t, ",")
      n = n + 1
      For j = 0 To UBound(t)
        arr(n, j + 1) = t(j)
      Next
      If n = NUM Then
        Cells(1, m + 1).Resize(NUM, UBound(arr, 2)) = arr
        n = 0: m = m + 12
        ReDim arr(1 To NUM, 1 To 11)
      End If
    End If
  Loop
  Close #1
  Application.ScreenUpdating = True
End Sub

TA的精华主题

TA的得分主题

发表于 2018-7-24 15:58 | 显示全部楼层
用pandas和numpy
  1. import pandas as pd
  2. import numpy as np
  3. import os
  4. os.chdir(r'文件所在目录')

  5. df=pd.read_csv('文件名',sep=',')这里看文件具体情况用什么分隔符
  6. i=1
  7. for data in np.array_split(df,24)
  8.     filename=str(i)+'.xlsx'
  9.     data.to_excel(filename,index=False)
  10.     i+=1
复制代码

TA的精华主题

TA的得分主题

 楼主| 发表于 2018-7-24 16:35 | 显示全部楼层

TA的精华主题

TA的得分主题

发表于 2018-7-24 16:41 | 显示全部楼层
本帖最后由 sheeboard 于 2018-7-24 16:42 编辑
1朝风月3 发表于 2018-7-24 16:35
用access能处理吗?

是python语言里的两个库,用于大数据处理的。
https://www.anaconda.com/download/#download,下个平台安装包装一下。

TA的精华主题

TA的得分主题

发表于 2018-7-24 21:27 | 显示全部楼层

TA的精华主题

TA的得分主题

发表于 2018-7-24 21:33 来自手机 | 显示全部楼层
这么大的数据量!大手笔啊!

TA的精华主题

TA的得分主题

 楼主| 发表于 2018-7-25 09:11 | 显示全部楼层

TA的精华主题

TA的得分主题

 楼主| 发表于 2018-7-25 09:13 | 显示全部楼层
[广告] VBA代码宝 - VBA编程加强工具 · VBA代码随查随用  · 内置多项VBA编程加强工具       ★ 免费下载 ★      ★使用手册
sheeboard 发表于 2018-7-24 16:41
是python语言里的两个库,用于大数据处理的。
https://www.anaconda.com/download/#download,下个平台安 ...

谢谢您!我试试!
您需要登录后才可以回帖 登录 | 免费注册

本版积分规则

手机版|关于我们|联系我们|ExcelHome

GMT+8, 2025-1-10 20:38 , Processed in 0.028004 second(s), 8 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 1999-2023 Wooffice Inc.

沪公网安备 31011702000001号 沪ICP备11019229号-2

本论坛言论纯属发表者个人意见,任何违反国家相关法律的言论,本站将协助国家相关部门追究发言者责任!     本站特聘法律顾问:李志群律师

快速回复 返回顶部 返回列表