| 成果基本信息 | ||||||
| 关键词: | 微博,情感分析,分类模型 | |||||
| 成果类别: | 应用技术 | 技术成熟度: | 初期阶段 | |||
| 体现形式(基础理论类): | 其他 | 体现形式(应用技术类): | 新技术 | |||
| 成果登记号: | 资源采集日期: | |||||
| 研究情况 | |||||
| 单位名称: | 武汉理工大学 | 技术水平: | 未评价 | ||
| 评价证书号: | 评价单位: | ||||
| 评价日期: | 评价证书号: | ||||
| 转化情况 | |||||
| 转让范围: | 合作开发 | 推广形式: | 合作开发 | ||
| 已转让企业数(个): | |||||
| 联系方式 | |||||
| 联系人(平台): | 孵化基地 | 联系人(平台)电话: | 0771-3394012 | ||
| *成果单位详细联系方式请登录会员;还不是会员,马上注册! | |||||
| 成果简介 | |||||
本发明涉及一种基于松散条件下协同学习的中文微博情感分析方法,包括:(1)构建初始已标注微博数据集L和未标注微博数据集U;(2)对已标注数据集L和未标注数据集U进行特征提取;(3)构造SVM分类器C1和LSTM分类器C2,利用已标注数据集L对C1、C2分别进行训练;(4)利用训练好的两个分类模型对未标注数据集U进行预测;(5)选择未标注样本加入到训练集,以修正分类模型。本发明的优点在于充分考虑了文本中不确定性和置信度这些信息量,从而能选取对两个分类模型最有帮助的样本数据进行人工标注以减少噪声样本的引入;并且分别从词法信息要素的角度和文本上下文相关的语法角度来构造协同学习的框架,提高分类的准确率 |