ExcelHome技术论坛

 找回密码
 免费注册

QQ登录

只需一步,快速开始

快捷登录

搜索
EH技术汇-专业的职场技能充电站 妙哉!函数段子手趣味讲函数 Excel服务器-会Excel,做管理系统 效率神器,一键搞定繁琐工作
HR薪酬管理数字化实战 Excel 2021函数公式学习大典 Excel数据透视表实战秘技 打造核心竞争力的职场宝典
让更多数据处理,一键完成 数据工作者的案头书 免费直播课集锦 ExcelHome出品 - VBA代码宝免费下载
用ChatGPT与VBA一键搞定Excel WPS表格从入门到精通 Excel VBA经典代码实践指南
12
返回列表 发新帖
楼主: pumasarel

[求助]如何不重复地统计字数

[复制链接]

TA的精华主题

TA的得分主题

 楼主| 发表于 2007-2-2 01:05 | 显示全部楼层

 验证结果如下:

以新概念为验证文本。改进后得6222词,实际为5714词,6222-5714/6222=8%.改进为8067词,8067-5714/8067=29%.即改进后的误差比为8%,改进前的为29%.假设用其它文本验证,两个程序的得数分别乘以92%和71%,那么所得数越接近则理论上这两个程序越正确。我分别用了5-6个10万-20万词的文本验证,差数都在100-300之间。最后用新概念第一册验证,这册实际词汇量为857,字数为7932,用两个程序分别得数为1234及893,分别乘以这两个比值,得数分别为876和821,基本接近。

初步结论如下:运行这两个程序的得数分别乘以71%和92%,基本接近实际词汇量。误差在可接受的100-300之间。两个程序皆可用。

谢谢konggs!

TA的精华主题

TA的得分主题

 楼主| 发表于 2007-2-2 01:07 | 显示全部楼层
验证结果如下:

以新概念为验证文本。改进后得6222词,实际为5714词,6222-5714/6222=8%.改进为8067词,8067-5714/8067=29%.即改进后的误差比为8%,改进前的为29%.假设用其它文本验证,两个程序的得数分别乘以92%和71%,那么所得数越接近则理论上这两个程序越正确。我分别用了5-6个10万-20万词的文本验证,差数都在100-300之间。最后用新概念第一册验证,这册实际词汇量为857,字数为7932,用两个程序分别得数为1234及893,分别乘以这两个比值,得数分别为876和821,基本接近。

初步结论如下:运行这两个程序的得数分别乘以71%和92%,基本接近实际词汇量。误差在可接受的100-300之间。

谢谢konggs!

TA的精华主题

TA的得分主题

发表于 2007-2-4 11:14 | 显示全部楼层

英文单词加s,ing,ed等后缀等情况应该考虑进去,不然统计的结果不能当生字表来用。

出来乍到,多多指教!

TA的精华主题

TA的得分主题

发表于 2007-2-4 11:19 | 显示全部楼层

TA的精华主题

TA的得分主题

发表于 2007-2-4 14:19 | 显示全部楼层
有那位朋友不嫌麻烦给解释一下怎样应用以上程序,不胜感激!

TA的精华主题

TA的得分主题

发表于 2007-2-5 10:37 | 显示全部楼层
这好像不是统计单词数,把统计结果生成单词表不知可不可以?
您需要登录后才可以回帖 登录 | 免费注册

本版积分规则

手机版|关于我们|联系我们|ExcelHome

GMT+8, 2024-11-17 13:49 , Processed in 0.030326 second(s), 7 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 1999-2023 Wooffice Inc.

沪公网安备 31011702000001号 沪ICP备11019229号-2

本论坛言论纯属发表者个人意见,任何违反国家相关法律的言论,本站将协助国家相关部门追究发言者责任!     本站特聘法律顾问:李志群律师

快速回复 返回顶部 返回列表