主要内容

ratioSentimentScores

使用比率规则进行情感评分

描述

使用ratioSentimentScores用比例规则评价标记文本的情感。的ratioSentimentScores函数默认使用VADER情感词典。

例子

compoundScores= ratioSentimentScores (文档根据正令牌和负令牌的比率返回令牌化文档的情绪得分。对于正分数与负分数之比大于1的每个文档,该函数返回1。对于负分与正分之比大于1的每个文档,该函数返回-1。否则,函数返回0。

compoundScorespositiveScoresnegativeScores) = ratioSentimentScores (文档也分别返回文档的正标记分数和负标记分数的总和。

例子

___= ratioSentimentScores (___名称,值使用一个或多个名称-值对指定其他选项。

例子

全部折叠

创建标记化文档。

str = [“这本书非常好!!!!”“这本书糟透了。”];文件= tokenizedDocument (str);

评估标记化文档的情绪。1分表示正面情绪,-1分表示负面情绪,0分表示中性情绪。

compoundScores = ratioSentimentScores(文档)
compoundScores =2×11

情感分析算法依赖于被称为情感词典的带注释的单词列表。例如,ratioSentimentScoresFunction使用了一个情感词典,其中的词语注释的情感得分范围从-1到1,得分接近1表示强烈的积极情绪,得分接近-1表示强烈的消极情绪,得分接近零表示中性情绪。

如果情感词汇被使用ratioSentimentScores功能不适合您正在分析的数据,例如,如果您有一个领域特定的数据集,如医疗或工程数据,那么您可以使用自己的自定义情感词典。有关如何生成特定领域情感词典的示例,请参见生成领域特定情感词典

创建包含要分析的文本数据的标记化文档数组。

textData = [“这家公司的增长势头非常强劲。”“另一家公司被指控误导消费者。”];文件= tokenizedDocument (textData);

加载金融数据的示例域特定词汇表。

文件名=“financeSentimentLexicon.csv”;台= readtable(文件名);头(台)
ans =8×2表Token SentimentScore _________________ ______________ {'opportunities'} 0.95633 {'innovative'} 0.89635 {'success'} 0.84362 {'focused'} 0.83768 {'strong'} 0.81042 {'capabilities'} 0.79174 {'innovation'} 0.77698 {'improved'} 0.77176

评估情绪使用ratioSentimentScores函数指定自定义情感词典“SentimentLexicon”选择。1分表示正面情绪,-1分表示负面情绪,0分表示中性情绪。

compoundScores = ratioSentimentScores(文档,“SentimentLexicon”(资源)
compoundScores =2×11

输入参数

全部折叠

输入文档,指定为tokenizedDocument数组中。

名称-值参数

指定可选的逗号分隔的对名称,值参数。的名字参数名和价值为对应值。的名字必须出现在引号内。可以以任意顺序指定多个名称和值对参数Name1, Value1,…,的家

例子:0.5阈值,将比率阈值设置为0.5

情感词典,指定为一个表,有以下几列:

  • 令牌—Token,指定为字符串标量。

  • SentimentScore—令牌情感得分,指定为数字标量。

默认的情感词典是VADER情感词典。

数据类型:表格

比值阈值,指定为非负标量。

若为正分数与负分数之比文档(我)大于阈值,然后compoundScores(我)是1。若负分数与正分数之比文档(我)大于阈值,然后compoundScores(我)是1。否则,compoundScores(我)是0。

数据类型:||int8|int16|int32|int64|uint8|uint16|uint32|uint64

输出参数

全部折叠

以数字矢量返回的复合情感得分。该函数为每个输入文档返回一个分数。

若为正分数与负分数之比文档(我)大于阈值,然后compoundScores(我)是1。若负分数与正分数之比文档(我)大于阈值,然后compoundScores(我)是1。否则,compoundScores(我)是0。

积极情绪得分,以数字矢量返回。该函数为每个输入文档返回一个分数。的值positiveScores(我)对应的是正面情绪得分文档(我)

消极情绪得分,以数字矢量返回。该函数为每个输入文档返回一个分数。的值negativeScores(我)对应的是消极情绪得分文档(我)

介绍了R2019b