文本分析工具箱和MeCab

1视图(30天)
小渊秀一
小渊秀一 2019年12月25日
评论道: 小渊秀一2020年3月10日
我想添加一些文字MeCab字典,我想使用它背后Matlab textanalytics工具箱。
标记化的过程使得有些字太短。
如果你有任何想法来解决我的问题,这将是appricated。

答案(1)

克里斯托弗Creutzig
克里斯托弗Creutzig 2020年3月9日
文本分析工具箱不船工具编译一个扩展MeCab字典。但是如果你有一个字段(我知道有这样的编译词典用于医疗目的,例如,您可以使用 mecabOptions tokenizedDocument 使用它。
或者,如果你只有少数单词你想保存,不担心词形变化,您可以使用 “CustomTokens” 通过他们记号赋予器:
tokenizedDocument (“日本睡眠学会のガイドライン”)
ans =
tokenizedDocument:
5令牌:日本睡眠学会のガイドライン
tokenizedDocument (“日本睡眠学会のガイドライン”,“CustomTokens”,“日本睡眠学会”)
ans =
tokenizedDocument:
3令牌:日本睡眠学会のガイドライン
1评论
小渊秀一
小渊秀一 2020年3月10日
谢谢你的回复。我已经解决了这个问题通过使用UserModel选项。无论如何,我很高兴有你的信息。

登录置评。

类别

找到更多的在字符和字符串帮助中心文件交换

下载188bet金宝搏


释放

R2019b

社区寻宝

找到宝藏在MATLAB中央,发现社区如何帮助你!

开始狩猎!