您好,欢迎来到 空包网!请 登录 / 免费注册 新手必看
空包网

35空包网:情感分析研究现状

发布时间:2020-03-22 来源:空包网
  35空包网:基于词典的方法
  
  情感词典是文本情感分析的基础。利用构建的文本情感词典,并对情感词典 进行极性和强度标注,进而进行文本情感分类,能够有效地对文本进行情感分析。 Yang (2012)等考虑到用户行为,在改进的SO_PMI算法的基础上建立了一个汉 语情感词汇库,并对收集的中国酒店评论的情绪进行分类,结果表明,改进后的 SO_PMI在权重计算和情感词汇构建方面更为有效【67]。周咏梅(2013)等采用上下 文熵的网络用语发现策略,通过TF-IDF二次过滤得到网络用语,并利用SO_PMI 算法在己标注的微博语料库中计算网络用语的情感倾向值,构建网络用语情感词 典,实验结果表明,其分类效果好于朴素贝叶斯分类器,并具有分类过程简单、 快速等优势[681。王勇等(2014)根据中文微博中情感表达的特点,构建了基础情 感词典、表情符号词典以及双重否定词典,融合汉语语言学特征和微博情感表达 特征,提出一种新的基于极性词典的情感分类方法,其准确率达到82.2%,对中文 微博进行较好的情感分类[69]。Bmvo_Marquez等(2016)针对意见词典无法捕获 twitter中表达随意的帖子的局限性,提出了一种将自动注释的tweet和现有的手工 意见词典中的信息结合起来,以有监督的方式扩展意见词典,扩展词典包含具有 正、负和中性极性类的概率分布的词性(POS)消除歧义的条目。杨小平等(2017) 通过神经网络语言模型对大规模中文语料进行统计训练,提出了基于转换约束集 的多维情感词典自动构建方法,其构建的10种情绪标注的多维汉语情感词典 SentiRuc,在类别标注检验、强度标注检验、情感消歧效果及情感分类任务中均具 有良好的效果。
  
  35空包网:基于机器学习的方法
  
  该方法通过训练数据对测试数据进行识别,然后进行特征提取。通过模型训 练生成文本情感分析模型,然后进行文本情感分析。Shamia等(2013)提出了一 种基于Boosted SVM的混合情感分类模型,应用于基于情感的在线评论分类任务, 结果表明,在基于情感的分类的准确性方面,具有装袋或增强的SVM集合明显优 于单个SVM。Batista等(2013)提出了一种基于二元最大熵分类器的策略,并 对西班牙推特数据的自动情绪分析和主题分类,实验表明,开发的系统在主题分 类方面取得了最好的效果。Yan等(2015)通过对基于统计方法的中英文情感分 析进行学习,建立了基于最大熵模型的藏文句子情感分析系统,测试结果表明, 评价参数良好,可以在一定程度上达到实用性。Jin等(2015)针对金融业的特 点,提出了运用斯坦福句法依存分析的SVM分类法。通过对重要金融网站的数据 在线提取实验,F的综合值达到82.1%,比较准确。Wikarsa等(2016)幵发了 —个利用naive bayes进行加权和分类用户六种情绪(即快乐、悲伤、愤怒、厌恶、 恐惧和惊讶)的文本挖掘应用程序来检测推特用户的情绪。Dey等(2016)探 索了两种有监督的机器学习算法KNN和NB在电影评论和酒店评论的情感分类效 果,结果表明,电影评论下,NB比KNN好很多,对于酒店评论,则基本一致.
 
上一篇文章              下一篇文章