如何找到最常见的单词在文本通过matlab
17日视图(30天)
显示旧的评论
如何标记POS在MATLAB的名词和动词,与正则表达式吗?我知道找到一个正则表达式模式在文本,但是我想找到最常见的单词在文本和标记POS(我指的是单词是名词或动词)然后交换POS和一双陌生的单词。我怎么能找到最常见的单词在文本通过MATLAB ?有什么解决方案,或者我应该使用另一个软件?
0评论
接受的答案
克里斯托弗Creutzig
2017年11月2日
编辑:克里斯托弗Creutzig
2018年11月26日
找到最常见的单词很容易与文本分析工具箱:
> >十四行诗= extractFileText (“sonnets.txt”);
> >十四行诗= erasePunctuation(十四行诗);
> > tokenizedSonnets = tokenizedDocument(低(十四行诗));
> >袋= bagOfWords (tokenizedSonnets);
> > topkwords(袋,10)
ans =
10×2表
词数
___________
”和“490年
“的”436年
”到“409年
“我的”371年
“的”370年
“我”344年
“在”321年
“,”320年
“你”281年
“你”234年