CN104239554A - 跨领域跨类别的新闻评论情绪预测方法 - Google Patents
跨领域跨类别的新闻评论情绪预测方法 Download PDFInfo
- Publication number
- CN104239554A CN104239554A CN201410494851.6A CN201410494851A CN104239554A CN 104239554 A CN104239554 A CN 104239554A CN 201410494851 A CN201410494851 A CN 201410494851A CN 104239554 A CN104239554 A CN 104239554A
- Authority
- CN
- China
- Prior art keywords
- sigma
- exp
- omega
- domain
- news
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000008451 emotion Effects 0.000 title claims abstract description 45
- 238000000034 method Methods 0.000 title claims abstract description 41
- 238000012549 training Methods 0.000 claims abstract description 44
- 238000012546 transfer Methods 0.000 claims abstract description 7
- 230000002996 emotional effect Effects 0.000 claims description 37
- 239000013598 vector Substances 0.000 claims description 32
- 238000005457 optimization Methods 0.000 claims description 13
- 238000007477 logistic regression Methods 0.000 claims description 8
- 238000013145 classification model Methods 0.000 abstract description 6
- 238000002372 labelling Methods 0.000 abstract description 4
- 230000006870 function Effects 0.000 description 31
- 238000005516 engineering process Methods 0.000 description 6
- 238000013526 transfer learning Methods 0.000 description 5
- 238000012552 review Methods 0.000 description 4
- 238000012360 testing method Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000005065 mining Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000002889 sympathetic effect Effects 0.000 description 2
- 208000019901 Anxiety disease Diseases 0.000 description 1
- 244000097202 Rathbunia alamosensis Species 0.000 description 1
- 235000009776 Rathbunia alamosensis Nutrition 0.000 description 1
- 239000008186 active pharmaceutical agent Substances 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 230000036506 anxiety Effects 0.000 description 1
- 238000002790 cross-validation Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000008092 positive effect Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提出了一种跨领域跨类别的新闻评论情绪预测方法。本发明公开的方法,是在目标领域只有少量的标注数据而在另一相关但不相同的源领域拥有大量的标注数据条件下,通过模拟源领域和目标领域情绪类别集合间关系,实现不同领域间的知识迁移,构建跨领域跨类别的新闻评论情绪预测模型,从而解决目标领域新闻评论的情绪预测问题。在源领域与目标领域为不同情绪类别集合情境下,本发明的方法显著地优于其他跨领域跨类别在线新闻评论的情绪预测的替代方法,并且极大降低人工标注工作的高昂代价和训练更多分类模型所耗费的精力。本发明可用于用户情感分析和舆情监督。
Description
技术领域
本发明属于web信息检索与挖掘领域,具体涉及异构新闻内容,评论内容,用户情感等多种信息源,对在线新闻评论情绪进行预测的方法。
背景技术
近年来,随着信息检索、机器学习、自然语言处理领域的快速发展,文本挖掘和情感分析问题引起了研究者的广泛关注。基于监督学习的情感分类方法纷纷涌现,成为了情感分析中的研究热点。如何建立一个在多领域通用的新闻评论情感预测方法,利用一个领域的知识帮助其他领域分类模型的学习,是一个亟待解决的问题。以下将多类情绪划分的情绪分类问题称为“情绪分类(emotion classification)”,区别于二类情感极性划分的“情感倾向性分类”。
情感分析需要在当前领域充足的训练数据集建立分类器,但是这往往需要大量的人工标注工作,这种标注工作劳动强度大,十分耗时且代价高昂。因此,为了降低人工标注工作的高昂代价和训练更多分类模型所耗费的精力,构建跨领域的情感分类方法,用某一领域的标注的训练数据集来帮助另一相关但不相同、仅有少量标注的训练数据集的其他领域进行情感分析,具有重要研究意义和应用价值。
跨领域(cross-domain)情感分类问题包括跨领域的情绪分类、跨领域的情感倾向性分类和跨领域跨类别(cross-category)的情感分类问题,其中,跨领域跨类别的情感分类问题是在源领域(source domain)和目标领域(target domain)采用不同的多类情绪类别集合,或是一个领域采用情感倾向性类别集合,而另一领域采用多类情绪类别集合的情境下进行跨领域情绪预测。
迁移学习(transfer learning)技术是解决这个问题的常用手段,将相关领域(源领域)知识迁移至目标领域,来帮助目标领域分类模型的学习。有研究者将两个不同领域中具有良好主观识别性的特征作为领域独立的特征来实现领域迁移,并利用电影评论和产品评论数据对其方法进行验证。SCL算法是一种迁移学习的高效方法,采用了领域适应技术来解决情感分析问题。SCL算法基于ASO优化技术的特征表示知识迁移学习方法,利用源领域和目标领域的未标注数据抽取在两个领域经常出现且表现相同的支点特征,然后模拟支点特征和其他特征的相关性,并利用相关性信息确定一些新的共享特征,以降低领域间数据分布的差异。但是,即使加入这些新的特征,数据分布差异的问题仍然存在于原始的特征空间上。另外,SCL算法的性能很大程度上取决于支点特征选择的优劣,因此常常达不到很好的效果。
此外,大量的情感分析工作多是基于二类情感倾向性的分析,不能直接应用于多类情绪分类问题。另外,根据源领域和目标领域是否共享相同情绪类别,现存的迁移学习技术局限于在任务/领域共享相同的情绪类别条件下实现知识迁移,不同领域使用不同情绪类别的情境是已有方法所不能解决的。而本发明是首次将跨领域情感分析问题扩展到跨情绪类别的情景中,用以解决更为实际的在不同情绪类别下不同领域的情感分析问题。
发明内容
本发明的目的是解决有着不同情绪类别的相关但不相同的两个领域中的新闻评论情绪预测问题,提出一种跨领域跨类别的新闻评论情绪预测方法。
本发明针对现有技术中的问题,采用机器学习技术,创新性地提出跨领域跨类别的新闻评论情绪预测方法,极大降低了人工标注工作的高昂代价和训练更多分类模型所耗费的精力,解决其他方法无法解决的不同情绪类别情景下的跨领域情感分析问题。
本发明提出的跨领域跨类别的新闻评论情绪预测方法,包括如下步骤:
第1、对跨领域新闻评论情绪预测问题进行形式化描述
定义1:源领域(source domain)和目标领域(target domain)分别为DS和DT;
定义2:源领域和目标领域的情绪类别标签集合分别为ES和ET:
其中,代表源领域DS的新闻评论中可能表达的用户情绪类别标签,代表DT的新闻评论中可能表达的用户情绪类别标签,ET构成了该目标领域新闻评论情绪分类问题的输出空间;
定义3:源领域DS中的新闻评论文档集合CS,其新闻评论的数量充足;目标领域DT中的新闻评论文档集合CT,其新闻评论的数量相对较小:
定义4:向量为新闻评论的特征向量,向量为新闻评论的特征构成特征向量:
其中,表示评论的第j个特征,表示新闻评论的第j个特征;
定义5:向量为对应的新闻评论的标注,用来表示评论表达的情绪,
如果新闻评论标注的情绪是类 则中项 可表示为
定义6:向量为对应的新闻评论的标注,用来表示评论表达的情绪,
如果新闻评论标注的情绪是类 则中项 可表示为
定义7:在目标领域DT中,用于情绪预测模型训练的标注数据集有N,0≤N,条新闻和相应的情绪类别标签,可表示为
定义8:源领域DS中,用于情绪预测模型训练的标注数据集有M,0≤N<<M,条新闻和相应的情绪类别标签,可表示为
第2、构建利用情感间依赖关系实现知识迁移的模型
定义9:ω={ω1,ω2,…,ωK}为情绪的权重向量,ωl={ωl1,ωl2,…,ωln,bl}∈Rn+1为情绪的权值向量参数,ωk={ωk1,ωk2,…,ωkn,bk}∈Rn+1为对应情绪ek的权值向量参数;
定义10:是源领域DS的标注训练集中一个训练样本的损失,用关于权重参数ω={ω1,ω2,…,ωK}的函数,表示为此训练样本的负的对数似然函数值,即:
定义11:为DT中新闻评论被分到DS的情绪类的条件概率,根据多元逻辑斯谛回归模型,该条件概率可用软最大函数来表示,归一化的概率值即:
定义12:为DT中的新闻评论被分到源领域、目标领域共有的情绪ek∈ES=ET类的条件概率,根据多元逻辑斯谛回归模型,该条件概率可用软最大函数表示,归一化的概率值即:
定义13:和分别是和的权重向量,向量中的每一项为和中每一项的权重值,用υkl和υsl表示。
定义14:γ=(γ(1),γ(2),…,γ(M))是参数向量,用来模拟源领域和目标领域间数据分布的差异。
定义15:λ1,λ2,λ3≥0是系数参数,分别用以权衡目标领域损失函数、源领域损失函数、关于参数υ的正则化项和关于参数ω正则化项的相对重要程度。
定义16:是目标领域DT中的标注训练集中的一个训练样本的损失,根据多元逻辑斯谛回归模型的损失可由负的对数似然函数值作为损失函数来衡量,即
为模拟源领域和目标领域情绪类别间的关系,将目标领域的训练数据中的新闻评论分至源领域中每个情绪类别的条件概率作为特征,再利用多元逻辑回归模型将这些特征分至目标领域的情绪类别ek∈ET,k=1,2,…,KT中,实现将源领域的知识迁移至目标领域,即
源领域和目标领域统一的目标损失函数,表示为
其中,ω和υ是权重向量,也是整个公式的参数,需要进行参数估计获取;γ(i)用来模拟源领域和目标领域间数据分布的差异,以此差异作为权重将源领域的训练数据自然地编入到目标领域的目标损失函数中;R(ω)和R(v)是用来防止过拟合的两个参数的正则化项,采用参数向量的L2范数形式。
第3、利用边缘分布模拟源领域和目标领域的训练数据分布的差异γ
定义17:是源领域训练样本在目标领域DT的文本特征边缘分布。
定义18:是源领域训练样本在源领域DS的文本特征边缘分布。
源领域和目标领域的数据分布的差异γ由两个领域评论文本特征的边缘分布来模拟,γ的每一项即为
采用基于高斯核的核密度估计方法来估计γ(i),即
其中,σ是高斯核的带宽参数,分母中的-1项是为了消除属于源领域的训练样本自己在源领域估计概率值中的影响。
第4、求解参数ω和υ的估计值
定义19:ω*和υ*为目标损失函数极小化时ω和υ的估计值,即最优值。
定义20:和表示求解目标损失函数极小化过程中ω和υ的中间迭代结果。
以损失函数为目标函数,采用BFGS拟牛顿法求解ω*和υ*:
①采用一种迭代交替的优化方法来求解此以损失函数为目标函数关于参数ω和υ的联合优化问题,将目标函数表示为
②对于每次迭代,首先固定参数值将该问题转化成只关于参数ω的凸函数优化问题,即
采用BFGS拟牛顿法计算其梯度函数
使目标函数极小化,以求解使目标函数极小化的ω值再将参数ω固定为将目标函数联合优化问题转化成只关于参数υ的凸函数优化问题,
采用BFGS拟牛顿法计算其梯度函数
以求解使目标函数极小化的参数υ的值。
③迭代执行上述的交替过程直至收敛,就可以获得优化的参数值ω*和υ*。
本发明的优点和积极效果:
本发明提出了一种新颖的提出一种跨领域跨类别的新闻评论情绪预测方法,在目标领域只有少量的标注数据而在另一相关但不相同的源领域拥有大量的标注数据条件下,通过模拟源领域和目标领域情绪类别集合间关系,实现不同领域间的知识迁移,构建跨领域跨类别的新闻评论情绪预测模型,从而解决目标领域新闻评论的情绪预测问题。本发明首次解决跨领域跨类别在线新闻评论情感分析问题。
附图说明
图1为跨领域跨类别新闻评论情绪预测过程示意图。
图2为跨领域跨类别新闻评论情绪预测模型训练过程示意图。
图3为各数据集标注评论的情绪类别统计信息。
图4为各数据集标注评论的情感倾向统计信息。
具体实施方式
准备两个领域的新闻评论数据集,如2011年1月至2011年6月部分新浪新闻网站社会频道5,174个和腾讯新闻网站娱乐频道的5,431个热点新闻的评论,两个数据集的评论标注情绪类别以及情感倾向性的统计信息分别见图3和图4。对于社会领域和娱乐领域的新闻评论数据集,请专家为数据集中的每个评论标注情绪类别标签和情感倾向性标签,预定义的情绪类别与相对应的新闻网站所提供的用户情绪投票服务的情绪类别一致,情感倾向性则分为积极和消极两类。将社会领域作为源领域,娱乐领域作为目标领域;源领域使用8类情绪类别(感动、同情、愤怒、搞笑、难过、新奇、温馨、无聊)而目标领域使用二类情感倾向性类别(积极、消极)。至此,我们可以获得两个领域的新闻评论文档集合。
采用新闻评论文本内容中情绪词汇的词频作为特征。首先使用中国科学院计算技术研究所研制的汉语词法分析系统ICTCLAS(Institute of Computing Technology,ChineseLexical Analysis System)提供的中文分词功能,对新闻和评论的文本内容进行分词,再使用NTU情感分析词典和Hownet情感词典抽取表达情绪的词汇,最后统计情绪词汇的出现次数,即为词频,用词频构成社会领域(源领域)和娱乐领域(目标领域)的特征向量,即为源领域和目标领域的特征向量和
具体的和可通过以下方式获取。在社会领域和娱乐领域的新闻评论经过分词后,参照情感词典,将两个领域的新闻评论的词项中表达情感的词分别抽取出来作为该领域的特征,如笑呵呵、欣慰、幸福、暴跳如雷、勃然大怒、望而生畏、人心惶惶、痛苦、焦虑、怀疑等,并统计词频作为每条评论的特征向量,如以上词语在社会领域的训练数据集中出现次数分别为2次、24次、729次、3次、6次、23次、19次、302次、109次、58次等,那么新闻评论“这种事情弄得大家人心惶惶!一点幸福感都没有了!!严重怀疑他们的办事能力!”的特征向量则为(0,0,1,0,0,0,1,0,0,1,…),而社会领域的特征向量为(2,24,729,3,6,23,19,302,109,58,…)。在实际数据集上,每个领域的情感词即特征多达3000多个,由于情感词与实际数据集的文本内容息息相关,并不是固定不变的,故此处不一一列出本例中各领域的情感词以及特征向量。
源领域和目标领域的数据集根据是否加入情绪类别都分为两类:一类的和具有对应的情绪类别和如上面所示的新闻评论对应的表示该新闻评论的情绪类别为8类情绪类别(感动、同情、愤怒、搞笑、难过、新奇、温馨、无聊)中的第三个:愤怒。利用这些仅有少量标注的源领域和目标领域数据集作为训练数据集进行训练,具体过程如下。
得到源领域和目标领域用于训练的训练数据集以及对应的特征向量、目标领域中用于测试的新闻评论及其特征向量后,在源领域和目标领域的训练数据集上构建分类模型、计算模型中的参数,即可获得用于跨领域跨类别的情绪预测模型,此时输入目标领域中用于测试的新闻评论特征向量,跨领域跨类别的情绪预测模型即可输出该新闻评论对应的情感倾向性。
根据源领域和目标领域统一的目标损失函数
通过模拟两个领域之间的差异,根据前面的定义,将各个变量带入后得到目标损失函数:
接着进行优化该目标损失函数,求得使目标损失函数最小时的情绪类别y。算法过程如下。
输入:目标领域新闻评论文档集合CT,CT对应的训练数据集合TT,目标领域用于测试的新闻评论cT(目标领域的新闻评论集合CT减去用于训练的数据集合TT的部分)及其特征向量xT,源领域评论文档集合CS,CS对应的评论训练数据集合TS以及TS对应的特征向量xS;
输出:评论cT的情绪类别y。
①利用源领域的训练数据集估计领域数据分布差异:
②用10折交叉验证的方法在训练数据集中学习出最优的系数和
③用交替优化方法解目标函数为
的最优化问题,求得参数的最优估计值ω*和υ*;
④对于目标领域测试评论cT,依据其特征向量计算
由于本例中目标领域情感倾向性为2类,故k=1,2。因此对于如新闻评论“这种事情弄得大家人心惶惶!一点幸福感都没有了!!严重怀疑他们的办事能力!”的特征向量(0,0,1,0,0,0,1,0,0,1,…),带入到以上公式中,计算在k=1,2两种情况下的2个条件概率 和
④确定评论cT的情绪类别
此步骤即比较得到的 和 的大小,取值比较大的那个情况下的情感倾向性为评论的情绪类别,即当k=2时,情感倾向性为消极时,条件概率值较大,故该评论的情绪类别为消极。
⑤算法结束。
Claims (1)
1.跨领域跨类别的新闻评论情绪预测方法,包括如下步骤:
第1、对跨领域新闻评论情绪预测问题进行形式化描述
定义1:源领域(source domain)和目标领域(target domain)分别为DS和DT;
定义2:源领域和目标领域的情绪类别标签集合分别为ES和ET:
其中,代表源领域DS的新闻评论中可能表达的用户情绪类别标签,代表DT的新闻评论中可能表达的用户情绪类别标签,ET构成了该目标领域新闻评论情绪分类问题的输出空间;
定义3:源领域DS中的新闻评论文档集合CS,其新闻评论的数量充足;目标领域DT中的新闻评论文档集合CT,其新闻评论的数量相对较小:
定义4:向量为新闻评论的特征向量,向量为新闻评论的特征构成特征向量:
其中,表示评论的第j个特征,表示新闻评论的第j个特征;
定义5:向量为对应的新闻评论的标注,用来表示评论表达的情绪,
如果新闻评论标注的情绪是类 则中项 可表示为
定义6:向量为对应的新闻评论的标注,用来表示评论表达的情绪,
如果新闻评论标注的情绪是类 则中项 可表示为
定义7:在目标领域DT中,用于情绪预测模型训练的标注数据集有N,0≤N,条新闻和相应的情绪类别标签,可表示为
定义8:源领域DS中,用于情绪预测模型训练的标注数据集有M,0≤N<<M,条新闻和相应的情绪类别标签,可表示为
第2、构建利用情绪间依赖关系实现知识迁移的模型
定义9:ω={ω1,ω2,…,ωK}为情绪的权重向量,ωl={ωl1,ωl2,…,ωln,bl}∈Rn+1为情绪的权值向量参数,ωk={ωk1,ωk2,…,ωkn,bk}∈Rn+1为对应情绪ek的权值向量参数;
定义10:是源领域DS的标注训练集中一个训练样本的损失,用关于权重参数ω={ω1,ω2,…,ωK}的函数,表示为此训练样本的负的对数似然函数值,即:
定义11:为DT中新闻评论被分到DS的情绪类的条件概率,根据多元逻辑斯谛回归模型,该条件概率可用软最大函数来表示,归一化的概率值即:
定义12:为DT中的新闻评论被分到源领域、目标领域共有的情绪ek∈ES=ET类的条件概率,根据多元逻辑斯谛回归模型,该条件概率可用软最大函数表示,归一化的概率值即:
定义13:和分别是和的权重向量,向量中的每一项为和中每一项的权重值,用υkl和υsl表示;
定义14:γ=(γ(1),γ(2),…,γ(M))是参数向量,用来模拟源领域和目标领域间数据分布的差异;
定义15:λ1,λ2,λ3≥0是系数参数,分别用以权衡目标领域损失函数、源领域损失函数、关于参数υ的正则化项和关于参数ω正则化项的相对重要程度;
定义16:是目标领域DT中的标注训练集中的一个训练样本的损失,根据多元逻辑斯谛回归模型的损失可由负的对数似然函数值作为损失函数来衡量,即
为模拟源领域和目标领域情绪类别间的关系,将目标领域的训练数据中的新闻评论分至源领域中每个情绪类别的条件概率作为特征,再利用多元逻辑回归模型将这些特征分至目标领域的情绪类别ek∈ET,k=1,2,…,KT中,实现将源领域的知识迁移至目标领域,即
源领域和目标领域统一的目标损失函数,表示为
其中,ω和υ是权重向量,也是整个公式的参数,需要进行参数估计获取;γ(i)用来模拟源领域和目标领域间数据分布的差异,以此差异作为权重将源领域的训练数据自然地编入到目标领域的目标损失函数中;R(ω)和R(v)是用来防止过拟合的两个参数的正则化项,采用参数向量的L2范数形式;
第3、利用边缘分布模拟源领域和目标领域的训练数据分布的差异γ
定义17:是源领域训练样本在目标领域DT的文本特征边缘分布;
定义18:是源领域训练样本在源领域DS的文本特征边缘分布;
源领域和目标领域的数据分布的差异γ由两个领域评论文本特征的边缘分布来模拟,γ的每一项即为
采用基于高斯核的核密度估计方法来估计γ(i),即
其中,σ是高斯核的带宽参数,分母中的-1项是为了消除属于源领域的训练样本自己在源领域估计概率值中的影响;
第4、求解参数ω和υ的估计值
定义19:ω*和υ*为目标损失函数极小化时ω和υ的估计值,即最优值;
定义20:和表示求解目标损失函数极小化过程中ω和υ的中间迭代结果;
以损失函数为目标函数,采用BFGS拟牛顿法求解ω*和υ*:
①采用一种迭代交替的优化方法来求解此以损失函数为目标函数关于参数ω和υ的联合优化问题,将目标函数表示为
②对于每次迭代,首先固定参数值将该问题转化成只关于参数ω的凸函数优化问题,即
采用BFGS拟牛顿法计算其梯度函数
使目标函数极小化,以求解使目标函数极小化的ω值再将参数ω固定为将目标函数联合优化问题转化成只关于参数υ的凸函数优化问题,
采用BFGS拟牛顿法计算其梯度函数
以求解使目标函数极小化的参数υ的值;
③迭代执行上述的交替过程直至收敛,就能够获得优化的参数值ω*和υ*。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410494851.6A CN104239554A (zh) | 2014-09-24 | 2014-09-24 | 跨领域跨类别的新闻评论情绪预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410494851.6A CN104239554A (zh) | 2014-09-24 | 2014-09-24 | 跨领域跨类别的新闻评论情绪预测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN104239554A true CN104239554A (zh) | 2014-12-24 |
Family
ID=52227613
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410494851.6A Pending CN104239554A (zh) | 2014-09-24 | 2014-09-24 | 跨领域跨类别的新闻评论情绪预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104239554A (zh) |
Cited By (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104573030A (zh) * | 2015-01-14 | 2015-04-29 | 哈尔滨工业大学深圳研究生院 | 一种文本情绪预测方法及装置 |
CN106339412A (zh) * | 2016-08-12 | 2017-01-18 | 中国电子科技集团公司第二十八研究所 | 一种中文国际政治事件的参与者关系抽取方法 |
CN106446250A (zh) * | 2016-10-14 | 2017-02-22 | 张成良 | 一种基于云计算的个性化在线新闻评论情绪预测系统 |
CN106649434A (zh) * | 2016-09-06 | 2017-05-10 | 北京蓝色光标品牌管理顾问股份有限公司 | 一种跨领域知识迁移的标签嵌入方法和装置 |
CN107193836A (zh) * | 2016-03-15 | 2017-09-22 | 腾讯科技(深圳)有限公司 | 一种识别方法及装置 |
CN107220337A (zh) * | 2017-05-25 | 2017-09-29 | 北京大学 | 一种基于混合迁移网络的跨媒体检索方法 |
CN107222328A (zh) * | 2017-03-23 | 2017-09-29 | 广州华多网络科技有限公司 | 预测饱和拐点的方法及装置 |
CN107291837A (zh) * | 2017-05-31 | 2017-10-24 | 北京大学 | 一种基于领域适应性的网络文本的分词方法 |
CN107291754A (zh) * | 2016-04-01 | 2017-10-24 | 北京大学 | 新闻评论的预测方法和新闻评论的预测系统 |
CN107392242A (zh) * | 2017-07-18 | 2017-11-24 | 广东工业大学 | 一种基于同态神经网络的跨领域图片分类方法 |
CN107506775A (zh) * | 2016-06-14 | 2017-12-22 | 北京陌上花科技有限公司 | 模型训练方法及装置 |
CN107967337A (zh) * | 2017-12-05 | 2018-04-27 | 云南大学 | 一种基于情感极性增强语义的跨领域情感分析方法 |
CN108549692A (zh) * | 2018-04-13 | 2018-09-18 | 重庆邮电大学 | Spark框架下的稀疏多元逻辑回归模型对文本情感分类的方法 |
CN108595568A (zh) * | 2018-04-13 | 2018-09-28 | 重庆邮电大学 | 一种基于极大无关多元逻辑回归的文本情感分类方法 |
CN108829806A (zh) * | 2018-06-07 | 2018-11-16 | 中南大学 | 一种跨事件新闻文本情感分析方法 |
CN109189921A (zh) * | 2018-08-07 | 2019-01-11 | 阿里巴巴集团控股有限公司 | 评论评估模型的训练方法和装置 |
CN109284376A (zh) * | 2018-09-10 | 2019-01-29 | 成都信息工程大学 | 基于领域自适应的跨领域新闻数据情感分析方法 |
CN109308318A (zh) * | 2018-08-14 | 2019-02-05 | 深圳大学 | 跨领域文本情感分类模型的训练方法、装置、设备及介质 |
CN109684460A (zh) * | 2018-12-28 | 2019-04-26 | 四川新网银行股份有限公司 | 一种基于深度学习的负面网络舆情指数的计算方法及系统 |
CN109726745A (zh) * | 2018-12-19 | 2019-05-07 | 北京理工大学 | 一种融入描述知识的基于目标的情感分类方法 |
CN109872011A (zh) * | 2019-03-18 | 2019-06-11 | 重庆邮电大学 | 基于多元逻辑回归模型的家畜类生理状态预测方法与系统 |
CN114647724A (zh) * | 2022-02-22 | 2022-06-21 | 广东外语外贸大学 | 一种基于MPNet、Bi-LSTM和宽度学习的多源跨领域情绪分类方法 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103729456A (zh) * | 2014-01-07 | 2014-04-16 | 合肥工业大学 | 一种基于微博群环境的微博多模态情感分析方法 |
-
2014
- 2014-09-24 CN CN201410494851.6A patent/CN104239554A/zh active Pending
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103729456A (zh) * | 2014-01-07 | 2014-04-16 | 合肥工业大学 | 一种基于微博群环境的微博多模态情感分析方法 |
Non-Patent Citations (2)
Title |
---|
唐慧丰 等: ""基于监督学习的中文情感分类技术比较研究"", 《中文信息学报》 * |
张莹: ""在线新闻评论的情感分析研究"", 《中国博士学位论文全文数据库 信息科技辑》 * |
Cited By (37)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104573030A (zh) * | 2015-01-14 | 2015-04-29 | 哈尔滨工业大学深圳研究生院 | 一种文本情绪预测方法及装置 |
CN104573030B (zh) * | 2015-01-14 | 2017-12-12 | 哈尔滨工业大学深圳研究生院 | 一种文本情绪预测方法及装置 |
CN107193836B (zh) * | 2016-03-15 | 2021-08-10 | 腾讯科技(深圳)有限公司 | 一种识别方法及装置 |
CN107193836A (zh) * | 2016-03-15 | 2017-09-22 | 腾讯科技(深圳)有限公司 | 一种识别方法及装置 |
CN107291754B (zh) * | 2016-04-01 | 2020-12-04 | 北京大学 | 新闻评论的预测方法和新闻评论的预测系统 |
CN107291754A (zh) * | 2016-04-01 | 2017-10-24 | 北京大学 | 新闻评论的预测方法和新闻评论的预测系统 |
CN107506775A (zh) * | 2016-06-14 | 2017-12-22 | 北京陌上花科技有限公司 | 模型训练方法及装置 |
CN106339412B (zh) * | 2016-08-12 | 2019-09-10 | 中国电子科技集团公司第二十八研究所 | 一种中文国际政治事件的参与者关系抽取方法 |
CN106339412A (zh) * | 2016-08-12 | 2017-01-18 | 中国电子科技集团公司第二十八研究所 | 一种中文国际政治事件的参与者关系抽取方法 |
CN106649434B (zh) * | 2016-09-06 | 2020-10-13 | 北京蓝色光标品牌管理顾问股份有限公司 | 一种跨领域知识迁移的标签嵌入方法和装置 |
CN106649434A (zh) * | 2016-09-06 | 2017-05-10 | 北京蓝色光标品牌管理顾问股份有限公司 | 一种跨领域知识迁移的标签嵌入方法和装置 |
CN106446250A (zh) * | 2016-10-14 | 2017-02-22 | 张成良 | 一种基于云计算的个性化在线新闻评论情绪预测系统 |
CN107222328A (zh) * | 2017-03-23 | 2017-09-29 | 广州华多网络科技有限公司 | 预测饱和拐点的方法及装置 |
CN107222328B (zh) * | 2017-03-23 | 2020-08-28 | 广州华多网络科技有限公司 | 预测饱和拐点的方法及装置 |
CN107220337A (zh) * | 2017-05-25 | 2017-09-29 | 北京大学 | 一种基于混合迁移网络的跨媒体检索方法 |
CN107291837A (zh) * | 2017-05-31 | 2017-10-24 | 北京大学 | 一种基于领域适应性的网络文本的分词方法 |
CN107291837B (zh) * | 2017-05-31 | 2020-04-03 | 北京大学 | 一种基于领域适应性的网络文本的分词方法 |
CN107392242A (zh) * | 2017-07-18 | 2017-11-24 | 广东工业大学 | 一种基于同态神经网络的跨领域图片分类方法 |
CN107392242B (zh) * | 2017-07-18 | 2020-06-19 | 广东工业大学 | 一种基于同态神经网络的跨领域图片分类方法 |
CN107967337B (zh) * | 2017-12-05 | 2021-10-15 | 云南大学 | 一种基于情感极性增强语义的跨领域情感分析方法 |
CN107967337A (zh) * | 2017-12-05 | 2018-04-27 | 云南大学 | 一种基于情感极性增强语义的跨领域情感分析方法 |
CN108595568B (zh) * | 2018-04-13 | 2022-05-17 | 重庆邮电大学 | 一种基于极大无关多元逻辑回归的文本情感分类方法 |
CN108595568A (zh) * | 2018-04-13 | 2018-09-28 | 重庆邮电大学 | 一种基于极大无关多元逻辑回归的文本情感分类方法 |
CN108549692A (zh) * | 2018-04-13 | 2018-09-18 | 重庆邮电大学 | Spark框架下的稀疏多元逻辑回归模型对文本情感分类的方法 |
CN108549692B (zh) * | 2018-04-13 | 2021-05-11 | 重庆邮电大学 | Spark框架下的稀疏多元逻辑回归模型对文本情感分类的方法 |
CN108829806A (zh) * | 2018-06-07 | 2018-11-16 | 中南大学 | 一种跨事件新闻文本情感分析方法 |
CN109189921B (zh) * | 2018-08-07 | 2021-09-07 | 创新先进技术有限公司 | 评论评估模型的训练方法和装置 |
CN109189921A (zh) * | 2018-08-07 | 2019-01-11 | 阿里巴巴集团控股有限公司 | 评论评估模型的训练方法和装置 |
CN109308318B (zh) * | 2018-08-14 | 2021-06-04 | 深圳大学 | 跨领域文本情感分类模型的训练方法、装置、设备及介质 |
CN109308318A (zh) * | 2018-08-14 | 2019-02-05 | 深圳大学 | 跨领域文本情感分类模型的训练方法、装置、设备及介质 |
CN109284376A (zh) * | 2018-09-10 | 2019-01-29 | 成都信息工程大学 | 基于领域自适应的跨领域新闻数据情感分析方法 |
CN109726745B (zh) * | 2018-12-19 | 2020-10-09 | 北京理工大学 | 一种融入描述知识的基于目标的情感分类方法 |
CN109726745A (zh) * | 2018-12-19 | 2019-05-07 | 北京理工大学 | 一种融入描述知识的基于目标的情感分类方法 |
CN109684460A (zh) * | 2018-12-28 | 2019-04-26 | 四川新网银行股份有限公司 | 一种基于深度学习的负面网络舆情指数的计算方法及系统 |
CN109872011A (zh) * | 2019-03-18 | 2019-06-11 | 重庆邮电大学 | 基于多元逻辑回归模型的家畜类生理状态预测方法与系统 |
CN114647724A (zh) * | 2022-02-22 | 2022-06-21 | 广东外语外贸大学 | 一种基于MPNet、Bi-LSTM和宽度学习的多源跨领域情绪分类方法 |
CN114647724B (zh) * | 2022-02-22 | 2024-07-19 | 广东外语外贸大学 | 一种基于MPNet、Bi-LSTM和宽度学习的多源跨领域情绪分类方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104239554A (zh) | 跨领域跨类别的新闻评论情绪预测方法 | |
CN111160037B (zh) | 一种支持跨语言迁移的细粒度情感分析方法 | |
CN109670039B (zh) | 基于三部图和聚类分析的半监督电商评论情感分析方法 | |
CN107491531B (zh) | 基于集成学习框架的中文网络评论情感分类方法 | |
CN112434720B (zh) | 一种基于图注意力网络的中文短文本分类方法 | |
CN105260356B (zh) | 基于多任务学习的中文交互文本情感与话题识别方法 | |
CN105117428B (zh) | 一种基于词语对齐模型的web评论情感分析方法 | |
Huang et al. | Research on multi-label user classification of social media based on ML-KNN algorithm | |
Yang et al. | Learning transferred weights from co-occurrence data for heterogeneous transfer learning | |
CN102831184B (zh) | 根据对社会事件的文字描述来预测社会情感的方法及系统 | |
CN108765383B (zh) | 基于深度迁移学习的视频描述方法 | |
CN107832663A (zh) | 一种基于量子理论的多模态情感分析方法 | |
CN105930411A (zh) | 一种分类器训练方法、分类器和情感分类系统 | |
Hu et al. | Listening to the crowd: Automated analysis of events via aggregated twitter sentiment. | |
CN110245229A (zh) | 一种基于数据增强的深度学习主题情感分类方法 | |
CN109919368B (zh) | 一种基于关联图的法条推荐预测系统及方法 | |
CN104298776B (zh) | 基于lda模型的搜索引擎结果优化系统 | |
CN107679580A (zh) | 一种基于多模态深度潜在关联的异构迁移图像情感极性分析方法 | |
CN106980608A (zh) | 一种中文电子病历分词和命名实体识别方法及系统 | |
CN105760507A (zh) | 基于深度学习的跨模态主题相关性建模方法 | |
CN106649434A (zh) | 一种跨领域知识迁移的标签嵌入方法和装置 | |
CN104794500A (zh) | 一种tri-training半监督学习方法及装置 | |
CN104036010A (zh) | 一种基于半监督cbow的用户搜索词主题分类的方法 | |
CN105205043A (zh) | 一种新闻读者情绪的分类方法与系统 | |
CN112069320B (zh) | 一种基于跨度的细粒度情感分析方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20141224 |