继续请教孔兄。多次测试中,发现孔兄编写的代码除前贴提到的诸多优点外,存在一个问题。 下为测试文档内容: ====== 当时,镇守山海关的是明朝总兵吴三桂。关外是虎视眈眈的清兵,关内是风卷残去的农民军。何去何从,吴三桂犯难了。为抗击清兵,明朝在这里建筑了坚固的防御体系。吴三桂率“关宁铁骑”三万精兵镇守这里。山海关的有利地势,使吴三桂落到了历史天平上的砝码地位。李自成深知山海关的重要性,派唐通携带白银四万两,黄金千两,以封官许愿的敕书去招降吴三桂,此外,吴三桂的父亲吴襄也从京城给他写来了劝降信。而清军方面也从来没有放弃过对吴三桂的诱降,吴三桂的舅舅,叛将祖大寿从清营屡次给他写信,又是威逼,又是利诱,搞得吴三桂心里痒痒的。经过再三权衡,吴三桂决定投降农民军。吴三桂率部进京谒见李自成,抵达沙河驿时,突然而遇到从京城里逃出来的家人,说自己的爱妾陈圆圆被李自成的部将刘宗敏抢去占为已有。听说陈圆圆被掳走,吴三桂气得直发疯,他火速赶回山海关,袭击农民军。李自成一怒之下,押着吴襄,从北京亲自率军东征。 使用孔兄编写的代码得到的结果(已按频次排序): ======= 的:15/吴:14/三:14/桂:12/是:5/军:5/山海关:4/清:4/去:4/了:4/李自成:4/京:4/圆:4/农民:3/率:3/他:3/来:3/镇守:2/明朝:2/为:2/这里:2/万:2/两:2/襄:2/也:2/京城:2/给:2/写:2/信:2/而:2/过:2/将:2/又:2/得:2/说:2/陈:2/被:2/当时:1/总兵:1/关外:1/虎视眈眈:1/关内:1/风:1/卷:1/残:1/何去何从:1/犯难:1/抗击:1/在:1/建筑:1/坚固:1/防御:1/体系:1/宁:1/铁骑:1/精兵:1/有利:1/地势:1/使:1/落:1/到了:1/历史:1/天平:1/上:1/砝码:1/地位:1/深知:1/重要性:1/派:1/唐:1/通:1/携带:1/白银:1/四:1/黄金:1/千:1/以:1/封官许愿:1/敕:1/书:1/招降:1/此外:1/父亲:1/劝降:1/军方:1/面:1/从来:1/没有:1/放弃:1/对:1/诱降:1/舅舅:1/叛:1/祖:1/大:1/寿:1/营:1/屡次:1/写信:1/威逼:1/利诱:1/搞:1/心里:1/痒痒:1/经过:1/再三:1/权衡:1/决定:1/投降:1/率部:1/进:1/谒见:1/抵达:1/沙河:1/驿:1/突然:1/遇到:1/城里:1/逃:1/出来:1/家人:1/自己:1/爱:1/妾:1/刘:1/宗:1/敏:1/抢:1/占:1/已:1/听说:1/掳:1/走:1/气:1/直:1/发疯:1/火速:1/赶回:1/袭击:1/一怒之下:1/押:1/着:1/北京:1/亲自:1/东:1/征:1 在结果中,所有的字频得到了反映,但有相当一部分词没有统计出频率,如人名中只统计了李自成一词出现的次数。不知WORD是根据什么文件来统计词频的,是WORD是自带的词库(如微软拼音输入法词库)吗? |