使用RAKE提取关键词
你可以尝试不同的关键字提取算法,看看什么最适合你的数据。由于RAKE关键字算法使用基于分隔符的方法来提取候选关键字,因此提取的关键字可能非常长。或者,您可以尝试使用TextRank算法提取关键字,该算法以单个令牌作为候选关键字开始,然后在适当时合并它们。要使用TextRank提取关键字,使用textrankKeywords
函数。想要了解更多,请看使用TextRank从文本数据中提取关键词.
罗斯、斯图尔特、戴夫·恩格尔、尼克·克莱默和温迪·考利。“从单个文档中自动提取关键字。”文本挖掘:应用与理论1(2010): 1 - 20。