中文词频统计工具功能
全量统计方式:即统计给定多个文档中的所有词汇的出现词频;指定统计方式:只统计指定的某些特殊词汇的出现词频。
(注:可以选择只统中文词汇、英语词汇或标点符号。)
中文词频统计工具使用说明
1、在文本框中输入(或粘贴)中文或者英文文章,然后按“开始拆分并统计”按钮即可查看拆分结果和频率统计结果。可以生成两种拆分结果:(1)是按照原文顺序列出单词或句子;
(2)按照单词或者句子的拼音顺序排好序,当然,也可以通过打开文件的方式导入文章。
2、输出方式中也可带上编号。
3、在频率分析栏中可以通过点击列表标题,可以进行“编号”、“单词”、“出现频率”的排序—正序或逆序。
4、分析排序结果可以保存为txt文件,供大家后续继续分析。
中文词频统计工具常见问题
问:词频分析结果是什么样的?比如我想把一篇文档进行分词,统计出高频词汇,这样能做到吗?分词是单个字,还是一个词语?答:把一篇文档进行分词,统计出高频词汇,这就是这个软件的功能。分词是按语言学上的词语,比如“中化人民共和国”算一个词语。而且,对于一些新词,或特殊定义的词汇,如“新浪微博”这类新产生的词汇,软件提供了“自定义词汇表”功能,您只要把它添加到自定义的词汇表中,就可以作为一个词来进行统计。
更新日志
v3.16更新日志新版本Bug修正,优化。
以上便是KKX小编给大家分享介绍的词频统计工具!