使用TextRank提取关键字
您可以尝试不同的关键字提取算法,看看哪种算法最适合您的数据。由于TextRank关键字算法使用基于词性标签的方法来提取候选关键字,因此提取的关键字可以很短。或者,您可以尝试使用RAKE算法提取关键字,该算法提取分隔符之间出现的令牌序列作为候选关键字。要使用RAKE提取关键字,请使用rakeKeywords
函数。要了解更多信息,请参见使用RAKE从文本数据中提取关键字.
Mihalcea, Rada和Paul Tarau。“Textrank:为文本带来秩序。”在2004年自然语言处理经验方法会议论文集,第404-411页。2004.