主要内容

比例术

与比率规则的情感分数

描述

利用比例术用比率规则评估令牌化文本中的情感。这比例术默认情况下,功能使用Vader情感词典。

例子

化合物=比率符号(文件基于正象和负象表的比率,令牌化文件的回报情感得分。对于每个文档,正面得分与负分数的比率大于1,函数返回1.对于每个文档,负分数与正分数的比率大于1,函数返回-1。否则,函数返回0。

[[化合物,,,,阳性,,,,负面] =比例entimentscores(文件还分别返回文档的正和负令牌得分的总和。

例子

___=比率符号(___,,,,名称,价值使用一个或多个名称值对指定其他选项。

例子

全部收缩

创建一个令牌化文档。

str = [“这本书很好!!!”“这本书很糟糕。”];文档= tokenizedDocument(str);

评估令牌文件的情感。得分为1表示积极的情绪,得分为-1表示负面情绪,得分为0表示中性情绪。

COMPOUNDSCORES =比率符号(文档)
CompoundScores =2×11 -1

情感分析算法依赖于注释的单词列表,称为情感词典。例如,比例术功能使用一种情感词典,带有注释的单词,情感评分范围为-1至1,其中的分数接近1表示强烈的积极情绪,得分接近-1表示强烈的负面情绪,而得分接近零表示中性情绪。

如果情绪词典使用比例术函数不适合您正在分析的数据,例如,如果您具有特定于域的数据集(例如医学或工程数据),则可以使用自己的自定义情感词典。有关显示如何生成域特异性情绪词典的示例,请参见产生域特异性情感词典

创建一个包含用于分析的文本数据的令牌化文档数组。

textdata = [“这家公司表现出极大的增长。”“这家公司被指控误导消费者。”];documents = tokenizedDocument(textData);

加载示例域特异性词典以获取金融数据。

文件名=“ FinancesEntimentLexicon.csv”;tbl =可读取(文件名);头(TBL)
ans =8×2桌令牌sentimentscore _________________ ______________ {'机会'} 0.95633 {'创新'} 0.89635 {'Success'} 0.84362 {'focused'} 0.83768 {'83768} 0.77176

使用比例术功能并使用'sentimentlexicon'选项。得分为1表示积极的情绪,得分为-1表示负面情绪,得分为0表示中性情绪。

COMPOUNDSCORES =比值符号(文档,'sentimentlexicon',TBL)
CompoundScores =2×11 -1

输入参数

全部收缩

输入文档,指定为象征性文档大批。

名称值参数

指定可选的逗号分隔对名称,价值参数。姓名是参数名称和价值是相应的值。姓名必须出现在引号中。您可以按任何顺序指定几个名称和值对参数NAME1,Value1,...,Namen,Valuen

例子:阈值,0.5将比率阈值设置为0.5

情感词典,指定为具有以下列的表:

  • 令牌- 令牌,指定为字符串标量。

  • 情绪科- 令牌的情感评分,指定为数字标量。

默认情绪词典是Vader情感词典。

数据类型:桌子

比率阈值,指定为非负标量。

如果正分数与负分数的比率文档(i)大于临界点, 然后化合物(i)为1.如果负分数与正分数的比率文档(i)大于临界点, 然后化合物(i)是-1。否则,化合物(i)是0。

数据类型:单身的|双倍的|int8|INT16|INT32|INT64|UINT8|UINT16|UINT32|Uint64

输出参数

全部收缩

复合情绪得分,作为数字向量返回。该功能返回每个输入文档的一个分数。

如果正分数与负分数的比率文档(i)大于临界点, 然后化合物(i)为1.如果负分数与正分数的比率文档(i)大于临界点, 然后化合物(i)是-1。否则,化合物(i)是0。

积极的情感得分,作为数字向量返回。该功能返回每个输入文档的一个分数。价值阳性(i)对应于积极的情感得分文档(i)

负情感得分,作为数字向量返回。该功能返回每个输入文档的一个分数。价值负核(i)对应于负面情绪得分文档(i)

在R2019b中引入