텍스트에내포된감성분석하기

이예제에서는维达(价知道字典和情绪)中寻欢알고리즘을사용하여감성분석을수행하는방법을보여줍니다。

维德알고리즘은주석이있는단어목록(감성어휘사전)을사용하고,이목록의각단어에는그에상응하는감성점수가있습니다。维德알고리즘은텍스트에있는일련의단어의점수를조정하는단어목록도활용합니다。

증폭어——일련의토큰의감성을증폭시키는단어또는语法。예:“绝对”,“令人惊讶的”같은단어。
약화어——일련의토큰의감성을약화시키는단어또는语法。예:“几乎没有”,“有点”같은단어。
부정어——일련의토큰의감성을부정하는단어。예:“不”、“不是”같은단어。

텍스트에내포된감성을평가하려면vaderSentimentScores함수를사용하십시오。

데이터불러오기

readtable을사용하여파일weekendUpdates.xlsx에서텍스트데이터를추출합니다。파일weekendUpdates.xlsx에는해시태그“#周末”와“#假期”이포함된상태업데이트가들어있습니다。

文件名=“weekendUpdates.xlsx”；台= readtable(文件名,“TextType”，“字符串”）;头(台)

ans =8×2表ID TextData  __ _________________________________________________________________________________ 1”结婚纪念日快乐!下一站:巴黎!✈#度假“2”哈哈，在海滩上烧烤，加入自鸣得意的模式!准备好迎接周六的夜晚了吗?和我一起说——我需要一个假期!!这么多年来第一次在家清闲，这就是生活!6 .“我考试前的最后一个周末”7 .“我真不敢相信我的假期结束了，这么不公平”8 .“我等不及这个周末打网球了”

텍스트데이터에서토큰화된문서로구성된배열을만들고,처음몇개문서를표시합니다。

str = tbl.TextData;文件= tokenizedDocument (str);文档(1:5)

ans = 5x1 tokenizedDocument: 11令牌:周年快乐!下一站:巴黎!✈#度假16代币:哈哈，在沙滩上烧烤，加入自鸣得意的模式!13个代币:和我一起说——我需要一个假期!！！代币:这么多年来第一次在家清闲，这就是生活!#周末

감성평가하기

vaderSentimentLexicon함수를사용하여,토큰화된문서의감성을평가합니다。1에가까운점수는긍정감성을,1에가까운점수는부정감성을,0에가까운점수는중립감성을나타냅니다。

compoundScores = vaderSentimentScores(文件);

처음몇개문서의점수를표시합니다。

compoundScores (1:5)

ans =5×10.4738 0.9348 0.6705 -0.5067 0.7345

긍정감성과부정감성을지닌텍스트를워드클라우드로시각화합니다。

idx = compoundScores > 0;strPositive = str (idx);strNegative = str (~ idx);图次要情节(1、2、1)wordcloud (strPositive);标题(“积极情绪”次要情节(1、2、2)wordcloud (strNegative);标题(“负面情绪”）

참고항목

ratioSentimentScores|tokenizedDocument|vaderSentimentScores

文本分析工具箱문서

지원

入门与文本分析在MATLAB

立即下载