ExcelHome技术论坛

 找回密码
 免费注册

QQ登录

只需一步,快速开始

快捷登录

搜索
EH技术汇-专业的职场技能充电站 妙哉!函数段子手趣味讲函数 Excel服务器-会Excel,做管理系统 效率神器,一键搞定繁琐工作
HR薪酬管理数字化实战 Excel 2021函数公式学习大典 Excel数据透视表实战秘技 打造核心竞争力的职场宝典
让更多数据处理,一键完成 数据工作者的案头书 免费直播课集锦 ExcelHome出品 - VBA代码宝免费下载
用ChatGPT与VBA一键搞定Excel WPS表格从入门到精通 Excel VBA经典代码实践指南
查看: 795|回复: 1

[分享] 提取汉字公式

[复制链接]

TA的精华主题

TA的得分主题

发表于 2021-2-24 09:53 | 显示全部楼层 |阅读模式
[广告] Excel易用宝 - 提升Excel的操作效率 · Excel / WPS表格插件       ★免费下载 ★       ★ 使用帮助

转自 腾讯云 账户:数字科学社区

昨天一个前端的朋友找我帮忙用excel提取代码中的汉字(字符串),可算费了劲儿了,他要提取的内容均在单引号中,但问题是没有统一的规律,同一个单元格可能存在多个要提取的内容,而且汉字中间也夹杂其他字符。所以总结了一下提取汉字的几种情况。

一、用公式提取Excel单元格中的汉字

对于一个混杂各种字母、数字及其他字符和汉字的文本字符串,要提取其中的汉字,在Excel中通常可用下面的公式。

例如下图A列中的字符串,要在B列提取其中的汉字(或词语)。


如果汉字位于字符串的开头或结尾,用LEFT或RIGHT函数即可提取,例如上图中A2:A4区域中的字符串。在B2中输入下面的公式:

=LEFT(A2,LENB(A2)-LEN(A2))

就会返回字符串中开头的几个汉字。

说明:LENB函数和LEN函数都可用返回文本字符串中的字符数,不同的是,LENB函数会将每个汉字(双字节字符)的字符数按2计数,LEN函数则对所有的字符,无论是单字节还是双字节都按1计数,因而公式中的“LENB(A2)-LEN(A2)”返回文本字符串中的汉字个数。

同样对于A6:A8区域中的字符串,在B6中用RIGHT函数即可:

=RIGHT(A6,LENB(A6)-LEN(A6))

如果汉字位于字符串的中间,可使用下面的数组公式。例如图中A10:A12区域中的字符串,在B10中输入数组公式:

=MID(A10,MATCH(2,LENB(MID(A10,ROW(INDIRECT("1:"&LEN(A10))),1)),),LENB(A10)-LEN(A10))

公式输入完毕,按Ctrl+Shift+Enter结束。

说明:公式先用MID函数将字符串中的每个字符分解到到一个字符数组中,然后用LENB函数返回各字符的的字符数,对于汉字会返回“2”。用MATCH函数取得第一个“2”的位置,即第一个汉字的位置,最后再用MID函数提取汉字。

使用上述公式时要求字符串中的汉字是连续的,中间没有其它字符分隔。

如果字符串中的汉字之间有其它字符分隔,例如上图中的A14单元格,要提取其中的所有汉字,可用下面的自定义函数。方法是:

1. 按Alt+F11,打开VBA编辑器,单击菜单“插入→模块”,在代码窗口中输入粘贴下面的代码:

Function 提取汉字(sString As String) As StringDim regEx As ObjectSet regEx = CreateObject("VBScript.RegExp")With regEx'搜索整个字符串.Global = True'匹配非汉字.Pattern = "[^\u4e00-\u9fa5]"'将字符串中的非汉字替换为空提取汉字 = .Replace(sString, "")End WithSet regEx = NothingEnd Function

说明:上述代码定义了一个自定义函数“提取汉字”。代码利用RegExp对象使用正则表达式匹配模式,清除字符串中的所有非汉字,得到其中的汉字。

2. 返回Excel工作表界面,在B14单元格中输入公式:

=提取汉字(A14)

即可取得A14单元格字符串中的所有汉字。

二、用公式提取引号(某2个相同字符)之间的内容

公式:=MID(A2,FIND("'",A2)+1,FIND("^",SUBSTITUTE(A2,"'","^",2))-FIND("'",A2)-1)


如果要提取第一个字符和最后一个相同字符之间的内容,则修改公式为:

=MID(A2,FIND("'",A2)+1,FIND("^",SUBSTITUTE(A2,"'","^",LEN(A2)-LEN(SUBSTITUTE(A2,"'",""))))-FIND("'",A2)-1)

在excel中,如何查询字符串的第N次出现位置,或最后一次出现位置,使用公式:

最后一次出现位置=FIND("这个不重复就行",SUBSTITUTE(A1,"-"," 这个不重复就行",LEN(A1)-LEN(SUBSTITUTE(A1,"-",""))))第N次出现位置假如查第四个\的位置=find("这个不重复就行",substitute(A1,"\","这个不重复就行",4))
三、用FIND函数查找字符串中的双引号

有这样一个字符串        AB"CDEFG        想查找到双引号的位置, 公式是这样的

=FIND("""",E11)

而不是    =FIND(""",E11)


TA的精华主题

TA的得分主题

发表于 2022-9-27 20:35 | 显示全部楼层
学习了,感谢分享
您需要登录后才可以回帖 登录 | 免费注册

本版积分规则

手机版|关于我们|联系我们|ExcelHome

GMT+8, 2024-11-24 14:53 , Processed in 0.023041 second(s), 9 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 1999-2023 Wooffice Inc.

沪公网安备 31011702000001号 沪ICP备11019229号-2

本论坛言论纯属发表者个人意见,任何违反国家相关法律的言论,本站将协助国家相关部门追究发言者责任!     本站特聘法律顾问:李志群律师

快速回复 返回顶部 返回列表