ExcelHome技术论坛

 找回密码
 免费注册

QQ登录

只需一步,快速开始

快捷登录

搜索
EH技术汇-专业的职场技能充电站 妙哉!函数段子手趣味讲函数 Excel服务器-会Excel,做管理系统 Excel Home精品图文教程库
HR薪酬管理数字化实战 Excel 2021函数公式学习大典 Excel数据透视表实战秘技 打造核心竞争力的职场宝典
300集Office 2010微视频教程 数据工作者的案头书 免费直播课集锦 ExcelHome出品 - VBA代码宝免费下载
用ChatGPT与VBA一键搞定Excel WPS表格从入门到精通 Excel VBA经典代码实践指南
查看: 1866|回复: 6

[求助] 英语内容词频统计

[复制链接]

TA的精华主题

TA的得分主题

发表于 2020-3-16 11:25 | 显示全部楼层 |阅读模式
老师好,

我想通过该表进行词频统计

首先,我会将原始数据从 a2单元格依次填进表格(a列行数实际大于现有的行数)

按我的理解,可能会将 a2单元格到 a列最后一行进行首尾拼接

然后在这段内容中进行词频统计,依次找到两个单词出现频率最多的前10个词组及词频,三个单词出现频率最多的前10个词组及词频…

词频统计以逗号分隔,不要跨过逗号统计词频,例如:word1 word2, word3, word4 word5,两个单词只能统计成:word1 word2 / word4 word5, 而不能统计成 word2 word3 / word3 word4

单词与单词之间如果有以下单词则自动忽略,包括:the, a, an, in, on, under…,例如:word1 the word2,则统计为:word1 word2
(可以理解为a列内容拼接后先去掉这些单词)

请问怎么做到呢

非常感谢老师在百忙之中提供宝贵帮助

祝老师:健康,快乐,平安

工作簿1.zip

8.67 KB, 下载次数: 13

TA的精华主题

TA的得分主题

发表于 2020-3-16 12:02 | 显示全部楼层
[广告] Excel易用宝 - 提升Excel的操作效率 · Excel / WPS表格插件       ★免费下载 ★       ★ 使用帮助
你的要求估计没多少人会弄,重点原因,何为单词?何为单词词组?你能用文字解释表达得清楚吗?

TA的精华主题

TA的得分主题

发表于 2020-3-16 12:11 | 显示全部楼层
[广告] VBA代码宝 - VBA编程加强工具 · VBA代码随查随用  · 内置多项VBA编程加强工具       ★ 免费下载 ★      ★使用手册
Sub 按钮1_Click()
    Set d = CreateObject("scripting.dictionary")
    arr = [a1].CurrentRegion
    With CreateObject("vbscript.regexp")
        .Global = True
        .Pattern = "\b(the|a|an|in|on|under)\b"
        For j = 2 To UBound(arr)
            If Len(arr(j, 1)) > 0 Then
                str1 = .Replace(arr(j, 1), "")
                brr = Split(str1 & ", ", ", ")
                For i = 1 To UBound(brr)
                    If Len(brr(i)) Then d(brr(i)) = d(brr(i)) + 1
                Next i
            End If
        Next j
    End With
    [l1].Resize(d.Count) = WorksheetFunction.Transpose(d.keys)
    [m1].Resize(d.Count) = WorksheetFunction.Transpose(d.items)
End Sub

评分

1

查看全部评分

TA的精华主题

TA的得分主题

 楼主| 发表于 2020-3-16 12:12 | 显示全部楼层
microyip 发表于 2020-3-16 12:02
你的要求估计没多少人会弄,重点原因,何为单词?何为单词词组?你能用文字解释表达得清楚吗?

非常感谢老师回复

是的,您的看法是对的,单词指的是,两边为空格或标点的内容,比如: a desk is,这里面就出现了3个单词,分别是 a 和 desk 和 is,词组指的是2个或2个以上的单词

TA的精华主题

TA的得分主题

发表于 2020-3-16 12:13 | 显示全部楼层
[广告] Excel易用宝 - 提升Excel的操作效率 · Excel / WPS表格插件       ★免费下载 ★       ★ 使用帮助
剔除了楼主不需要统计的部分,
然后根据逗号分隔进行统计了,具体是词组还是单词,以及下一步处理,楼主斟酌来吧

工作簿1.zip

15.68 KB, 下载次数: 21

评分

1

查看全部评分

TA的精华主题

TA的得分主题

 楼主| 发表于 2020-3-16 12:17 | 显示全部楼层
liulang0808 发表于 2020-3-16 12:13
剔除了楼主不需要统计的部分,
然后根据逗号分隔进行统计了,具体是词组还是单词,以及下一步处理,楼主斟 ...

哈哈 非常感谢 非常荣幸 版主给予的宝贵帮助 谢谢您 版主

TA的精华主题

TA的得分主题

发表于 2020-3-16 12:19 | 显示全部楼层
wwin80 发表于 2020-3-16 12:12
非常感谢老师回复

是的,您的看法是对的,单词指的是,两边为空格或标点的内容,比如: a desk is,这 ...

你的回复是基于你人脑想象出来的解释进行了文字描述,但电脑是死的,请问,3600L、Hrs是单词吗?Projector with是单词还是词组?
您需要登录后才可以回帖 登录 | 免费注册

本版积分规则

手机版|关于我们|联系我们|ExcelHome

GMT+8, 2024-3-28 21:17 , Processed in 0.048989 second(s), 11 queries , Gzip On, Redis On.

Powered by Discuz! X3.4

© 1999-2023 Wooffice Inc.

沪公网安备 31011702000001号 沪ICP备11019229号-2

本论坛言论纯属发表者个人意见,任何违反国家相关法律的言论,本站将协助国家相关部门追究发言者责任!     本站特聘法律顾问:李志群律师

快速回复 返回顶部 返回列表