主要内容

vaderSentimentScores

情绪得分与维德算法

描述

使用vaderSentimentScores评估情绪标记化的文本与价知道字典和情绪(维达)算法中寻欢。的vaderSentimentScores函数使用,默认情况下,维德情绪词汇和修饰符单词列表。

功能只支持英语文本。金宝app

例子

compoundScores= vaderSentimentScores (文档)返回情绪得分为标记化的文档。函数计算复合分数通过聚合个人牌分数,根据算法规则,然后调整1和1之间的归一化。函数丢弃所有标记单个字符,没有出现在情绪词汇。

compoundScores= vaderSentimentScores (文档,名称,值)使用一个或多个指定附加选项名称-值对。

例子

(compoundScores,positiveScores,negativeScores,neutralScores)= vaderSentimentScores (___)也返回的文档的比例比积极、消极,和中立,分别使用任何以前的语法。

例子

全部折叠

创建一个标记化的文档。

str = [“这本书是很好的! ! ! !”“这本书不是很好。”];文件= tokenizedDocument (str);

评估情绪的标记化的文档。分数接近1表明积极的情绪,成绩接近1表明负面情绪,成绩接近于0表示中性情绪。

compoundScores = vaderSentimentScores(文档)
compoundScores =2×10.7264 - -0.3865

情绪分析算法,如维德依靠注释的词叫做情绪词汇列表。例如,维德使用情绪词汇与词汇注释与感情,分数从1到1,分数接近1表示强烈的积极情绪,成绩接近1表示强烈的负面情绪,成绩接近于零表示中性情绪。

分析文本的情绪使用维德算法,使用vaderSentimentScores函数。如果使用的情绪词汇vaderSentimentScores函数不适合您正在分析的数据,例如,如果你有一个特定领域的数据集,如医学或工程数据,那么您可以使用自己的自定义情感词典。为一个例子,演示如何生成一个特定领域情感词典,看看生成特定领域情感词典

创建一个标记化的文档数组包含文本数据分析。

textData = [“这公司表现出极其强劲的增长。”“这其他公司被指控误导消费者。”];文件= tokenizedDocument (textData);

加载示例领域特定词汇的金融数据。

文件名=“financeSentimentLexicon.csv”;台= readtable(文件名);头(台)
ans =8×2表{‘机会’}牌SentimentScore _________________ * * * 0.95633 0.89635{‘创新’}{‘成功’}0.84362{“集中”}0.83768 0.81042{“强大”}{‘能力’}{‘创新’}0.77698 0.79174 0.77176{‘改善’}

评估使用的情绪vaderSentimentScores功能和指定自定义情绪词汇使用“SentimentLexicon”选择。分数接近1表明积极的情绪,成绩接近1表明负面情绪,成绩接近于0表示中性情绪。

compoundScores = vaderSentimentScores(文档,“SentimentLexicon”(资源)
compoundScores =2×10.2740 - -0.1112

输入参数

全部折叠

输入文件,指定为一个tokenizedDocument数组中。

名称-值参数

指定可选的双参数作为Name1 = Value1,…,以=家,在那里的名字参数名称和吗价值相应的价值。名称-值参数必须出现在其他参数,但对的顺序无关紧要。

R2021a之前,用逗号来分隔每一个名称和值,并附上的名字在报价。

例子:“助推器”,(“verry”“verrry”)指定使用推进器“verry”和“verrrry”。

情感词典,指定为一个表列如下:

  • 令牌——令牌,指定为字符串标量。令牌必须是小写的。

  • SentimentScore——情绪得分的令牌,指定为数字标量。

当评估情绪,软件,默认情况下,忽略了令牌和一个字符替换emojis同等计算情绪得分前文本描述。例如,软件替换的实例emoji”“与文本“笑容的脸”,然后评估情绪的分数。如果您提供令牌和一个字符或emojis分数与相应的情绪SentimentLexicon,那么函数不删除或替换这些令牌。

默认的情绪词汇是维达情绪词汇。

数据类型:

辅助词或字格列表,指定为一个字符串数组。

函数使用助推器字格来提高后续的情绪令牌。例如,单词“绝对”和“令人惊讶的”。

单词列表,列表必须是列向量。字格的列表,列表的大小NumNgrams——- - - - - -maxN,在那里NumNgrams字格的数量,maxN的长度是最大的语法。的(i, j)元素的列表jth的话语法。如果单词的数量语法小于maxN,然后剩下的条目列表的行是空的。

助推器- gram必须小写。

默认列表助推器- gram的维达助推器。

数据类型:字符串

阻尼器的词或字格列表,指定为一个字符串数组。

的函数使用阻尼器- gram抑制情绪随后的令牌。例如,单词“几乎”和“有点”。

单词列表,列表必须是列向量。字格的列表,列表的大小NumNgrams——- - - - - -maxN,在那里NumNgrams字格的数量,maxN的长度是最大的语法。的(i, j)元素的列表jth的话语法。如果单词的数量语法小于maxN,然后剩下的条目列表的行是空的。

阻尼器- gram必须是小写的。

阻尼器的默认列表字格维德助推器列表。

数据类型:字符串

否定单词列表,指定为一个字符串数组。

这个函数使用否定句否定情绪随后的令牌。例如,说“不”和“不是”。

否定的词语必须小写。

否定句的默认列表是维达否定列表。

数据类型:字符串

输出参数

全部折叠

复合情绪得分,作为一个数值向量返回。函数返回一个得分为每个输入文档。的值compoundScores(我)对应的复合情绪得分文档(我)

功能决定了复合分数通过聚合个人牌得分,调整他们根据维达算法规则,然后纠正他们在1和1之间。

积极的情绪得分,作为一个数值向量返回。函数返回一个得分为每个输入文档。的值positiveScores(我)对应的积极情绪得分文档(我)

负面情绪得分,作为数字返回向量。函数返回一个得分为每个输入文档。的值negativeScores(我)对应的负面情绪得分文档(我)

中性情绪得分,作为数字返回向量。函数返回一个得分为每个输入文档。的值neutralScores(我)对应的中性情绪得分文档(我)

引用

[1]赫托克莱顿J。和埃里克·吉尔伯特。“维德:吝啬的基于规则的社会媒体文本情感分析模型”。In第八届国际AAAI会议在博客和社交媒体。2014年。

版本历史

介绍了R2019b