ExcelHome技术论坛

 找回密码
 免费注册

QQ登录

只需一步,快速开始

快捷登录

搜索
EH技术汇-专业的职场技能充电站 妙哉!函数段子手趣味讲函数 Excel服务器-会Excel,做管理系统 Excel Home精品图文教程库
HR薪酬管理数字化实战 Excel 2021函数公式学习大典 Excel数据透视表实战秘技 打造核心竞争力的职场宝典
300集Office 2010微视频教程 数据工作者的案头书 免费直播课集锦 ExcelHome出品 - VBA代码宝免费下载
用ChatGPT与VBA一键搞定Excel WPS表格从入门到精通 Excel VBA经典代码实践指南
查看: 6426|回复: 14

[求助] 从TXT文档内提取指定内容至EXCEL

[复制链接]

TA的精华主题

TA的得分主题

发表于 2018-7-19 18:42 | 显示全部楼层 |阅读模式
各位大神好!TXT文档内 <TR style 到下一个<TR style内为一小段,每一段内都有着NAME以及<TR style下的前l两个的<TD style文本,这些需要提取至附件EXCEL内NAME对应A列,第一个TD对应B列,第二个TD对应第三个

现急需从附件TXT文档内提取以上内容,困扰许久,求救!

yangben.rar

9.69 KB, 下载次数: 77

TA的精华主题

TA的得分主题

发表于 2018-7-19 21:21 | 显示全部楼层
import xlwt
from lxml import etree


def parser():
    '''打开文本文件,获取xml,存入变量'''
    f=open(r'E:\vba\vba实例经验\yangben\代码.txt','r')
    a=f.read()
    f.close()

    '''解析'''
    selector=etree.HTML(a)
    names=selector.xpath(r'//tr/td/input/@name')
    td1=selector.xpath(r'//tr/td[2]/text()')
    td2=selector.xpath(r'//tr/td[3]/text()')
    return names,td1,td2
   

def write(names,td1,td2):
    '''写入excel'''
    n=1
    wb=xlwt.Workbook()
    sht=wb.add_sheet('内容',cell_overwrite_ok=True)
    sht.write(0,0,'Name')
    sht.write(0,1,'工序段')
    sht.write(0,2,'工序')
    for i in range(len(names)):
        sht.write(n,0,names)
        sht.write(n,1,td1)
        sht.write(n,2,td2)
        n+=1
    wb.save('txt内容.xls')


def main():
    (names,td1,td2) =parser()
    write(names,td1,td2)


if __name__=='__main__':
    main()

txt内容.zip

8.96 KB, 下载次数: 59

TA的精华主题

TA的得分主题

发表于 2018-7-19 21:30 | 显示全部楼层
  1. ['外延', '外延', '#1EPIWA-BA3', 'V01', '1'],
  2. ['激光打标', '激光打标', '#1LASERMARK', 'V01', '2'],
  3. ['外延片清洗(1212)', '外延片清洗', '#3HCL0NC10M', 'V01', '3'],
  4. ['有机清洗', '#3SC1UNC10M', 'V01', '4'],
  5. ['ITO蒸发(1712)', 'ITO蒸发', '#4ITOEG103K', 'V01', '5'],
  6. ['检查', '#3ZDJY0D1J1', 'V01', '6'],
  7. ['ITO腐蚀光刻(1712)', '正胶匀胶', '#2304J00102', 'V01', '7'],
  8. ['正胶曝光2FG0506-1-N', '#2ITO000001', 'V01', '8'],
  9. ['显影1', '#2CS0000150', 'V01', '9'],
  10. ['显影后检查', '#2XYHJYD5J1', 'V01', '10'],
  11. ['ITO腐蚀(1712)', '打胶', '#3IPC15003M', 'V01', '11'],
  12. ['ITO腐蚀', '#3ITE04008M', 'V01', '12'],
  13. ['去胶清洗', '#3SF109005M', 'V01', '13'],
  14. ['检查', '#3ZDJY0D1J1', 'V01', '14'],
  15. ['刻蚀区光刻(1712)', '正胶匀胶', '#2304J00102', 'V01', '15'],
  16. ['正胶曝光2FG0506-2-L', '#2KSQ00000T', 'V01', '16'],
  17. ['显影1', '#2CS0000150', 'V01', '17'],
  18. ['显影后检查', '#2XHJDQJQC1', 'V01', '18'],
  19. ['刻蚀N区', '刻蚀前烘烤', '#5HBKHX1001', 'V01', '19'],
  20. ['刻蚀GaN', '#5GaNET115K', 'V01', '20'],
  21. ['磨边', '磨边', '#5EDGMS1001', 'V01', '21'],
  22. ['刻蚀N区后清洗(1704)', '去胶清洗', '#3SF2U7010M', 'V01', '22'],
  23. ['打胶1', '#3IPC25015M', 'V01', '23'],
  24. ['去胶清洗', '#3SF009005M', 'V01', '24'],
  25. ['检查', '#3ZDJD5J3C2', 'V01', '25'],
  26. ['ITO退火', 'ITO退火', '#4ANLLG1001', 'V01', '26'],
  27. ['生长SiO2(1308)', '生长SiO2', '#4PVDPE2230', 'V01', '27'],
  28. ['钝化层光刻(1712)', 'HMDS', '#2HMDSXP150', 'V01', '28'],
  29. ['正胶匀胶', '#2304J00102', 'V01', '29'],
  30. ['正胶曝光2FG0506-3-M', '#2DHC00000T', 'V01', '30'],
  31. ['显影1', '#2CS0000150', 'V01', '31'],
  32. ['显影后检查', '#2XYHJYD5J1', 'V01', '32'],
  33. ['钝化层腐蚀(1712)', '打胶', '#3IPC15003M', 'V01', '33'],
  34. ['SiO2腐蚀', '#3BOE20590S', 'V01', '34'],
  35. ['去胶清洗', '#3SF2U7010M', 'V01', '35'],
  36. ['打胶1', '#3IPC25015M', 'V01', '36'],
  37. ['检查', '#3ZDJY0D1J1', 'V01', '37'],
  38. ['焊点光刻(1712)', '负胶匀胶', '#2202J00801', 'V01', '38'],
  39. ['负胶曝光2FG0506-4-N', '#2HDC00000T', 'V01', '39'],
  40. ['负胶后烘', '#2HH0303117', 'V01', '40'],
  41. ['显影1', '#2CS0000150', 'V01', '41'],
  42. ['显影后检查', '#2XHJD5J1C1', 'V01', '42'],
  43. ['蒸发前表面处理', '打胶2', '#3IPC05003M', 'V01', '43'],
  44. ['冲水(1)', '#3DIW0NC18T', 'V01', '44'],
  45. ['焊点蒸发(1612)', '焊点蒸发', '#4METEG112K', 'V01', '45'],
  46. ['蓝膜剥离', '#3METAL-OFF', 'V01', '46'],
  47. ['去胶清洗', '#3SFNUNC03M', 'V01', '47'],
  48. ['检查', '#3ZJDJQV1M2', 'V01', '48'],
  49. ['ESD测试', 'ESD测试', '#6COW050601', 'V01', '49'],
  50. ['减薄(1302)', '减薄接收', '#6GRDSTR001', 'V01', '50'],
  51. ['测片原始厚度', '#6wafert001', 'V01', '51'],
  52. ['粘片', '#6WAXBOND01', 'V01', '52'],
  53. ['测片厚度', '#6D16055401', 'V01', '53'],
  54. ['减薄', '#6GRD450120', 'V01', '54'],
  55. ['研磨(1709)', '研磨', '#6LAPP03091', 'V01', '55'],
  56. ['下蜡', '#6WAXMOVE01', 'V01', '56'],
  57. ['下蜡清洗', '#6CLEANING1', 'V01', '57'],
  58. ['下蜡清洗检验', '#6CLCHECK01', 'V01', '58'],
  59. ['减薄送出', '#6GRDEND001', 'V01', '59'],
  60. ['划片', '划片接收', '#7SLSTART01', 'V01', '60'],
  61. ['贴膜', '#7chipcoat1', 'V01', '61', '2018/6/27 23:06:27'],
  62. ['划片', '#7L1NG05061', 'V01', '62', '2018/6/27 23:29:27'],
  63. ['裂片(不扩膜-1312)', '裂片', '#7SPL050601', 'V01', '63', '2018/6/27 23:52:27'],
  64. ['裂片倒膜', '#7DETAPEHP1', 'V01', '64', '2018/6/28 0:15:27'],
  65. ['测试扩膜(1609)', '测试接收', '#8--RECEIVE', 'V01', '65', '2018/6/28 0:15:27'],
  66. ['测试(0904)', '#820050506P', 'V01', '66', '2018/6/28 0:15:27'],
  67. ['扩膜', '#9130BINC-K', 'V01', '67', '2018/6/28 0:38:27'],
  68. ['分选前检验(1609)', '圆片清洗', '#9WAF-Q-FIP', 'V01', '68', '2018/6/28 23:58:27'],
  69. ['分选前检验', '#80000AOI00', 'V01', '69', '2018/6/28 23:58:27'],
  70. ['分拣(1707)', '分拣', '#9OK-IP0506', 'V01', '70', '2018/6/28 23:58:27']]
复制代码


TA的精华主题

TA的得分主题

发表于 2018-7-19 21:38 | 显示全部楼层

TA的精华主题

TA的得分主题

发表于 2018-7-19 21:47 | 显示全部楼层
sheeboard 发表于 2018-7-19 21:38
其实用pandas保存数据更方便。

pandas还没玩过呢,厉害

TA的精华主题

TA的得分主题

发表于 2018-7-19 22:45 | 显示全部楼层
像这种简单的表格网页源码数据提取到excel用不上代码,直接手动复制粘贴即可,方法是把首尾的  TBODY  改成  table  然后复制粘贴到excel即可,具体操作见下图

123.gif

TA的精华主题

TA的得分主题

 楼主| 发表于 2018-7-21 00:07 | 显示全部楼层
huang1314wei 发表于 2018-7-19 22:45
像这种简单的表格网页源码数据提取到excel用不上代码,直接手动复制粘贴即可,方法是把首尾的  TBODY  改成 ...

我主要需要这个name

TA的精华主题

TA的得分主题

 楼主| 发表于 2018-7-21 00:08 | 显示全部楼层
huang1314wei 发表于 2018-7-19 22:45
像这种简单的表格网页源码数据提取到excel用不上代码,直接手动复制粘贴即可,方法是把首尾的  TBODY  改成 ...

可是我主要需要这个name呀

TA的精华主题

TA的得分主题

 楼主| 发表于 2018-7-21 00:10 | 显示全部楼层

TA的精华主题

TA的得分主题

 楼主| 发表于 2018-7-21 00:15 | 显示全部楼层
任飘渺 发表于 2018-7-19 21:21
import xlwt
from lxml import etree

老师您这个是什么代码呀?是VBA吗?

您需要登录后才可以回帖 登录 | 免费注册

本版积分规则

关闭

最新热点上一条 /1 下一条

手机版|关于我们|联系我们|ExcelHome

GMT+8, 2024-4-24 05:42 , Processed in 0.047644 second(s), 11 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 1999-2023 Wooffice Inc.

沪公网安备 31011702000001号 沪ICP备11019229号-2

本论坛言论纯属发表者个人意见,任何违反国家相关法律的言论,本站将协助国家相关部门追究发言者责任!     本站特聘法律顾问:李志群律师

快速回复 返回顶部 返回列表