文档帮助中心文档
文档评分与TextRank算法
成绩= textrankScores(文档)
成绩= textrankScores(袋)
例子
分数= textrankScores (文档)分数文档利用TextRank算法根据两两相似度值确定重要性。为了计算相似度和重要性分数,该函数分别使用BM25和PageRank算法。
分数= textrankScores (文档)
分数
文档
分数= textrankScores (袋)对由bag-of-words或bag-of-n-grams模型编码的文档进行评分袋.
分数= textrankScores (袋)
袋
全部折叠
创建一个标记化文档数组。
str = ["那只敏捷的棕色狐狸跳过了那只懒狗""快速的棕色狐狸跳过了懒狗"这只懒狗坐在那里什么也不做。“其他动物坐在那里观看”];文件= tokenizedDocument (str)
译文:这只敏捷的棕色狐狸跳过了那只懒狗。译文:懒狗坐在那里什么也不做,其他的动物坐在那里观看
计算TextRank分数。
成绩= textrankScores(文件);
用条形图将分数形象化。
图酒吧(分数)包含(“文档”) ylabel (“分数”)标题(“TextRank分数”)
从文本数据中创建一个单词袋模型sonnets.csv.
sonnets.csv
文件名=“sonnets.csv”;台= readtable(文件名,“TextType”,“字符串”);textData = tbl.Sonnet;文件= tokenizedDocument (textData);袋= bagOfWords(文档)
单词:["From" " fairrest " "creatures" "we"…NumWords: 3527 NumDocuments: 154
成绩= textrankScores(袋);
tokenizedDocument
输入文档,指定为tokenizedDocument数组、字的字符串数组或字符向量的单元格数组。如果文档不是一个tokenizedDocument数组,则它必须是表示单个文档的行向量,其中每个元素都是一个单词。要指定多个文档,请使用tokenizedDocument数组中。
bagOfWords
bagOfNgrams
输入bag-of-words或bag-of-n-grams模型,指定为bagOfWords对象或一个bagOfNgrams对象。如果袋是一个bagOfNgrams对象,则该函数将每个n-gram视为单个单词。
TextRank分数,返回为N1的向量,分数(我)对应的是我输入文件和N是输入文档的数量。
分数(我)
我
Mihalcea, Rada和Paul Tarau。“Textrank:将秩序带入文本。”在2004年自然语言处理经验方法会议论文集, 404 - 411页。2004.
tokenizedDocument|bleuEvaluationScore|rougeEvaluationScore|bm25Similarity|cosineSimilarity|lexrankScores|mmrScores|extractSummary
bleuEvaluationScore
rougeEvaluationScore
bm25Similarity
cosineSimilarity
lexrankScores
mmrScores
extractSummary
您有这个示例的修改版本。您想打开这个示例与您的编辑吗?
你点击一个链接对应于这个MATLAB命令:
通过在MATLAB命令窗口中输入命令来运行命令。Web浏览器不支持MATLAB命令。金宝app
选择一个网站,在那里获得翻译的内容,并看到当地的活动和优惠。根据您的位置,我们建议您选择:.
你也可以从以下列表中选择一个网站:
选择中国网站(中文或英文)以获得最佳网站性能。其他MathWorks国家站点没有针对您所在位置的访问进行优化。
与当地办事处联系