基于语义和引用加权的文献主题提取研究

致谢	第4-5页
摘要	第5-6页
Abstract	第6页
1 绪论	第9-14页
1.1 研究背景及意义	第9-11页
1.1.1 研究背景	第9-11页
1.1.2 研究意义	第11页
1.2 研究内容及创新性	第11-12页
1.2.1 研究内容	第11-12页
1.2.2 研究创新性	第12页
1.3 本文组织结构	第12-14页
2 国内外研究综述	第14-26页
2.1 国内外著作、文献检索情况	第14-15页
2.2 国内外研究现状	第15-24页
2.2.1 基于加权算法的主题提取	第15-18页
2.2.2 基于本体或知识库的主题提取	第18-21页
2.2.3 基于主题概率模型的主题提取	第21-24页
2.3 本章小结	第24-26页
3 基于语义的主题提取技术	第26-35页
3.1 隐性语义索引	第27页
3.2 概率隐性语义索引	第27-28页
3.3 LDA模型	第28-32页
3.4 Labeled-LDA模型	第32-34页
3.5 本章小结	第34-35页
4 基于语义和引用加权的主题提取模型	第35-46页
4.1 基于引用加权的主题提取流程	第35-36页
4.2 词频/逆文档频率(TF-IDF)	第36-37页
4.3 基于引用内容的引文网络	第37-41页
4.3.1 文献之间的联系程度	第38-39页
4.3.2 基于全文数据的引文分析	第39-41页
4.4 基于引文的概率主题模型	第41-42页
4.5 聚类及主题提取	第42-45页
4.5.1 K-means聚类算法	第42-44页
4.5.2 主题提取	第44-45页
4.6 本章小结	第45-46页
5 实验与分析	第46-56页
5.1 数据来源	第46页
5.2 数据获取	第46-50页
5.2.1 标签(Label)的获取	第47-49页
5.2.2 引用内容的获取	第49-50页
5.3 基于Labeled-LDA模型的数据	第50-52页
5.3.1 基于引文的概率模型数据	第51-52页
5.4 聚类结果	第52页
5.5 主题提取	第52-54页
5.6 分析	第54-55页
5.7 本章小结	第55-56页
6 总结与展望	第56-58页
6.1 总结与讨论	第56-57页
6.2 不足	第57页
6.3 展望	第57-58页
参考文献	第58-64页
附录	第64-69页
附录1 72663条引用内容的主题概率分布	第64-67页
附录2 1791篇文档的主题概率分布	第67-69页