如何找到最常见的单词在文本通过matlab

17日视图(30天)
如何标记POS在MATLAB的名词和动词,与正则表达式吗?我知道找到一个正则表达式模式在文本,但是我想找到最常见的单词在文本和标记POS(我指的是单词是名词或动词)然后交换POS和一双陌生的单词。我怎么能找到最常见的单词在文本通过MATLAB ?有什么解决方案,或者我应该使用另一个软件?

接受的答案

克里斯托弗Creutzig
克里斯托弗Creutzig 2017年11月2日
编辑:克里斯托弗Creutzig 2018年11月26日
找到最常见的单词很容易与文本分析工具箱:
> >十四行诗= extractFileText (“sonnets.txt”);
> >十四行诗= erasePunctuation(十四行诗);
> > tokenizedSonnets = tokenizedDocument(低(十四行诗));
> >袋= bagOfWords (tokenizedSonnets);
> > topkwords(袋,10)
ans =
10×2表
___________
”和“490年
“的”436年
”到“409年
“我的”371年
“的”370年
“我”344年
“在”321年
“,”320年
“你”281年
“你”234年
你可能想要删除一些文字(查看 removeWords stopWords )。POS标签支持释放R2018b金宝app和后,明白了 addPartOfSpeechDetails
2的评论
克里斯托弗Creutzig
克里斯托弗Creutzig 2018年5月2日
你尝试了什么命令(s)读到文件?错误消息看起来像你试图读表;尝试使用上面列出的命令。

登录置评。

更多的答案(2)

莎拉Palfreyman
莎拉Palfreyman 2018年4月30日
编辑:莎拉Palfreyman 2018年4月30日
2的评论

登录置评。


夏尔曼谭
夏尔曼谭 2018年11月26日
嗨,发现我topkwords(最频繁的单词),我怎么画一个柱状图的?
2的评论
夏尔曼谭
夏尔曼谭 2018年11月26日
指出,我将这样做。谢谢!

登录置评。

社区寻宝

找到宝藏在MATLAB中央,发现社区如何帮助你!

开始狩猎!