摘要 | 第10-12页 |
ABSTRACT | 第12-14页 |
第一章 绪论 | 第15-35页 |
1.1 研究背景及意义 | 第15-21页 |
1.1.1 研究背景 | 第15-20页 |
1.1.2 研究意义 | 第20-21页 |
1.2 相关工作概述 | 第21-30页 |
1.2.1 网络分析与挖掘技术 | 第21-25页 |
1.2.2 文本聚类与挖掘技术 | 第25-28页 |
1.2.3 舆情分析技术 | 第28-30页 |
1.3 课题来源、研究内容与本文贡献 | 第30-33页 |
1.3.1 课题来源 | 第31页 |
1.3.2 研究内容与本文贡献 | 第31-33页 |
1.4 论文结构 | 第33-35页 |
第二章 面向文本的多属性异质网络构建框架与属性抽取 | 第35-51页 |
2.1 多属性异质网络 | 第35-37页 |
2.1.1 多属性异质网络的表示及性质 | 第36-37页 |
2.1.2 多属性异质网络的现实案例 | 第37页 |
2.2 基于多源文本属性的异质网络构建 | 第37-41页 |
2.2.1 多源网络文本分析流程 | 第38页 |
2.2.2 RAEF:面向文本的多属性网络构建框架 | 第38-41页 |
2.3 网络文本语义属性获取… | 第41-46页 |
2.3.1 属性提取核心技术分析 | 第41-42页 |
2.3.2 基于规则的方法:以专属领域情感分析为例 | 第42-45页 |
2.3.3 RAEF处理流程 | 第45-46页 |
2.4 实验分析 | 第46-50页 |
2.4.1 评测数据集与人工标注 | 第46-48页 |
2.4.2 实验评测方法 | 第48-49页 |
2.4.3 实验结果分析 | 第49-50页 |
2.5 本章小节 | 第50-51页 |
第三章 基于异质网络的文本聚类表示模型 | 第51-67页 |
3.1 研究背景 | 第51-52页 |
3.2 基于异构文本特征的HIN表示方法 | 第52-54页 |
3.2.1 微博文本的表示 | 第52-53页 |
3.2.2 新闻文本的表示 | 第53-54页 |
3.3 ABC:一种基于属性的协同聚类模型 | 第54-59页 |
3.3.1 基于属性的限制协同聚类方法 | 第54-57页 |
3.3.2 交互优化算法 | 第57-59页 |
3.4 实验分析 | 第59-66页 |
3.4.1 实验设置 | 第59-63页 |
3.4.2 文本表示特征贡献分析 | 第63页 |
3.4.3 文本表示质量分析 | 第63-64页 |
3.4.4 实体聚类数分析 | 第64-65页 |
3.4.5 迭代次数分析 | 第65-66页 |
3.5 本章小结 | 第66-67页 |
第四章 基于异质网络的多源文本互聚类分析技术 | 第67-89页 |
4.1 问题提出 | 第67-69页 |
4.2 问题描述 | 第69页 |
4.3 HINT:一种异质网络文本互聚类方法 | 第69-79页 |
4.3.1 相似性矩阵构建 | 第69-71页 |
4.3.2 文本关联关系及转移矩阵 | 第71-72页 |
4.3.3 推文和新闻的分别聚类 | 第72-73页 |
4.3.4 对歧见的惩罚 | 第73-75页 |
4.3.5 平衡的HIN聚类目标方程 | 第75页 |
4.3.6 目标方程的简化 | 第75-76页 |
4.3.7 目标方程的求解与优化 | 第76-79页 |
4.4 实验分析 | 第79-87页 |
4.4.1 数据集的描述和预处理 | 第79-81页 |
4.4.2 实验设置 | 第81-83页 |
4.4.3 互聚类结果分析 | 第83-84页 |
4.4.4 互聚类内容相关性分析 | 第84-85页 |
4.4.5 互聚类稳定性分析 | 第85-86页 |
4.4.6 案例学习 | 第86-87页 |
4.5 本章小节 | 第87-89页 |
第五章 基于多标注的多属性社交网络聚类分析技术 | 第89-113页 |
5.1 问题提出 | 第89-91页 |
5.2 问题形式化定义 | 第91-92页 |
5.3 CGMA:多属性稀疏标注问题方法 | 第92-101页 |
5.3.1 多标注集的组合 | 第93-97页 |
5.3.2 综合引导下的局部聚类 | 第97-99页 |
5.3.3 CGMA方法的并行计算 | 第99-100页 |
5.3.4 复杂度分析 | 第100-101页 |
5.4 实验分析 | 第101-112页 |
5.4.1 实验设置 | 第101-102页 |
5.4.2 人工数据集实验 | 第102-108页 |
5.4.3 真实数据集聚类分析 | 第108-112页 |
5.5 本章小节 | 第112-113页 |
第六章 总结与展望 | 第113-117页 |
6.1 本文主要研究工作总结 | 第113-114页 |
6.2 后续研究工作展望 | 第114-117页 |
6.2.1 多源文本摘要技术研究 | 第114页 |
6.2.2 多源文本语义融合技术研究 | 第114页 |
6.2.3 复杂情况下聚类分析技术研究 | 第114-117页 |
致谢 | 第117-119页 |
参考文献 | 第119-135页 |
作者在学期间取得的学术成果 | 第135-137页 |
攻读博士学位期间参与的科研项目 | 第137页 |