摘要 | 第4-5页 |
Abstract | 第5-6页 |
第1章 绪论 | 第13-17页 |
1.1 课题背景 | 第13-15页 |
1.2 本文工作 | 第15-16页 |
1.3 本文组织 | 第16-17页 |
第2章 相关技术 | 第17-27页 |
2.1 元数据提取技术 | 第17-22页 |
2.1.1 决策树模型 | 第17-19页 |
2.1.2 支持向量机模型 | 第19-21页 |
2.1.3 隐马尔科夫模型 | 第21-22页 |
2.2 标签抽取技术 | 第22-24页 |
2.2.1 TF-IDF关键词抽取模型 | 第22-23页 |
2.2.2 贝叶斯关键短语抽取模型 | 第23-24页 |
2.3 专家聚合技术 | 第24-26页 |
2.3.1 Apriori关联规则挖掘模型 | 第24页 |
2.3.2 FP-Growth关联规则挖掘模型 | 第24-26页 |
2.4 本章小结 | 第26-27页 |
第3章 论文元数据混合提取模型 | 第27-53页 |
3.1 元数据定义 | 第27-29页 |
3.2 基于规则和SVM的元数据混合提取模型 | 第29-45页 |
3.2.1 研究现状分析 | 第29-31页 |
3.2.2 PDF文献元数据分析 | 第31-34页 |
3.2.3 特征提取 | 第34-37页 |
3.2.4 元数据混合提取模型 | 第37-45页 |
3.3 模型评测与应用 | 第45-51页 |
3.3.1 数据集 | 第45-46页 |
3.3.2 运行环境 | 第46页 |
3.3.3 模型评测 | 第46-50页 |
3.3.4 工具应用 | 第50-51页 |
3.4 本章小结 | 第51-53页 |
第4章 专家数据挖掘与聚合 | 第53-77页 |
4.1 文献标签定义 | 第53-55页 |
4.1.1 标签定义与特征 | 第53-54页 |
4.1.2 标签的属性 | 第54页 |
4.1.3 实体关联关系 | 第54-55页 |
4.2 文献关系挖掘 | 第55-63页 |
4.2.1 基于频繁项挖掘的共生词分析 | 第55-57页 |
4.2.2 基于并查集的研究领域发现与提取 | 第57-59页 |
4.2.3 基于改进K-mean算法的文献聚类 | 第59-63页 |
4.3 文献标签抽取 | 第63-74页 |
4.3.1 研究现状分析 | 第63-65页 |
4.3.2 问题描述与数据分析 | 第65-66页 |
4.3.3 基于融合加权的TextRank关键词标签抽取 | 第66-73页 |
4.3.4 基于MI互信息量计算的关键短语抽取 | 第73-74页 |
4.4 专家关系挖掘 | 第74-76页 |
4.4.1 合作专家聚合 | 第74-76页 |
4.4.2 基于领域的专家标签抽取 | 第76页 |
4.5 本章小结 | 第76-77页 |
第5章 专家画像系统设计和实现 | 第77-88页 |
5.1 系统介绍 | 第77-78页 |
5.2 系统架构 | 第78-82页 |
5.2.1 开发与运行平台 | 第78-79页 |
5.2.2 Web技术路线 | 第79-81页 |
5.2.3 功能结构 | 第81-82页 |
5.3 系统关键模块 | 第82-86页 |
5.3.1 专家列表与基本信息模块 | 第83页 |
5.3.2 专家影响因子模块 | 第83-84页 |
5.3.3 专家研究领域模块 | 第84-85页 |
5.3.4 专家聚合模块 | 第85-86页 |
5.3.5 专家研究成果模块 | 第86页 |
5.4 本章小结 | 第86-88页 |
第6章 总结与展望 | 第88-90页 |
6.1 本文主要工作和贡献 | 第88页 |
6.2 未来研究工作展望 | 第88-90页 |
参考文献 | 第90-94页 |
致谢 | 第94页 |