摘要 | 第1-5页 |
ABSTRACT | 第5-6页 |
目录 | 第6-9页 |
第一章 绪论 | 第9-16页 |
·研究背景与意义 | 第9-10页 |
·相关研究现状 | 第10-14页 |
·基于内容的用户兴趣点的挖掘研究 | 第10页 |
·基于协同过滤的用户兴趣点的挖掘研究 | 第10-12页 |
·基于内容与协同过滤的用户兴趣点挖掘研究 | 第12页 |
·基于知识库与协同过滤的用户兴趣点挖掘研究 | 第12-14页 |
·本文的组织结构 | 第14-16页 |
第二章 用户兴趣点挖掘算法及相关技术 | 第16-30页 |
·算法思想及改进 | 第16-18页 |
·知识库 | 第18-19页 |
·文本分类 | 第19-29页 |
·短文本分类 | 第19-21页 |
·长文本分类 | 第21-29页 |
·用户兴趣建模 | 第29-30页 |
第三章 知识库的构建 | 第30-41页 |
·维基百科 | 第30页 |
·全文检索与Lucene | 第30-31页 |
·基于Wiki-lucene知识库的构建 | 第31-35页 |
·Wiki语料的处理 | 第32-33页 |
·Wiki-Lucene索引的建立 | 第33-35页 |
·类目的定义 | 第35-38页 |
·基于Category-Wiki-Lucene的知识库 | 第38-41页 |
第四章 查询词分类 | 第41-55页 |
·查询词扩展方法 | 第41-42页 |
·基于共现词扩展的查询词分类 | 第42-49页 |
·Google搜索 | 第42-44页 |
·共现词的计算 | 第44-46页 |
·共现词扩展后分类 | 第46-49页 |
·基于WordNet扩展的查询词分类 | 第49-55页 |
·WordNet | 第49页 |
·基于WordNet进行查询扩展 | 第49-50页 |
·基于WordNet进行查询扩展的改进 | 第50-51页 |
·基于WordNet扩展的查询词分类 | 第51-54页 |
·基于共现词和WordNet扩展的查询词分类 | 第54-55页 |
第五章 URL分类 | 第55-65页 |
·URL分类中网页正文提取 | 第55-59页 |
·HTML | 第55页 |
·网页正文提取方法 | 第55-56页 |
·基于块的网页正文提取方法 | 第56-58页 |
·网页正文提取结果 | 第58-59页 |
·URL分类中文本分类器的训练 | 第59-65页 |
·训练集的准备 | 第59页 |
·文档预处理 | 第59-60页 |
·基于DFSD算法的特征提取算法 | 第60-62页 |
·基于SVM分类器训练 | 第62-65页 |
第六章 用户兴趣投射 | 第65-70页 |
·浏览历史分类 | 第65-66页 |
·基于上下文的兴趣投射 | 第66-70页 |
·基本思想 | 第66-68页 |
·实现流程 | 第68-70页 |
第七章 实验结果分析及系统展示 | 第70-76页 |
·查询词分类对比实验 | 第70-73页 |
·URL分类对比实验 | 第73页 |
·系统演示 | 第73-76页 |
第八章 结论与展望 | 第76-78页 |
参考文献 | 第78-83页 |
攻读硕士期间发表的论文 | 第83-84页 |
致谢 | 第84页 |