首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于知识库与文本分类算法的用户兴趣点挖掘研究

摘要第1-5页
ABSTRACT第5-6页
目录第6-9页
第一章 绪论第9-16页
   ·研究背景与意义第9-10页
   ·相关研究现状第10-14页
     ·基于内容的用户兴趣点的挖掘研究第10页
     ·基于协同过滤的用户兴趣点的挖掘研究第10-12页
     ·基于内容与协同过滤的用户兴趣点挖掘研究第12页
     ·基于知识库与协同过滤的用户兴趣点挖掘研究第12-14页
   ·本文的组织结构第14-16页
第二章 用户兴趣点挖掘算法及相关技术第16-30页
   ·算法思想及改进第16-18页
   ·知识库第18-19页
   ·文本分类第19-29页
     ·短文本分类第19-21页
     ·长文本分类第21-29页
   ·用户兴趣建模第29-30页
第三章 知识库的构建第30-41页
   ·维基百科第30页
   ·全文检索与Lucene第30-31页
   ·基于Wiki-lucene知识库的构建第31-35页
     ·Wiki语料的处理第32-33页
     ·Wiki-Lucene索引的建立第33-35页
   ·类目的定义第35-38页
   ·基于Category-Wiki-Lucene的知识库第38-41页
第四章 查询词分类第41-55页
   ·查询词扩展方法第41-42页
   ·基于共现词扩展的查询词分类第42-49页
     ·Google搜索第42-44页
     ·共现词的计算第44-46页
     ·共现词扩展后分类第46-49页
   ·基于WordNet扩展的查询词分类第49-55页
     ·WordNet第49页
     ·基于WordNet进行查询扩展第49-50页
     ·基于WordNet进行查询扩展的改进第50-51页
     ·基于WordNet扩展的查询词分类第51-54页
     ·基于共现词和WordNet扩展的查询词分类第54-55页
第五章 URL分类第55-65页
   ·URL分类中网页正文提取第55-59页
     ·HTML第55页
     ·网页正文提取方法第55-56页
     ·基于块的网页正文提取方法第56-58页
     ·网页正文提取结果第58-59页
   ·URL分类中文本分类器的训练第59-65页
     ·训练集的准备第59页
     ·文档预处理第59-60页
     ·基于DFSD算法的特征提取算法第60-62页
     ·基于SVM分类器训练第62-65页
第六章 用户兴趣投射第65-70页
   ·浏览历史分类第65-66页
   ·基于上下文的兴趣投射第66-70页
     ·基本思想第66-68页
     ·实现流程第68-70页
第七章 实验结果分析及系统展示第70-76页
   ·查询词分类对比实验第70-73页
   ·URL分类对比实验第73页
   ·系统演示第73-76页
第八章 结论与展望第76-78页
参考文献第78-83页
攻读硕士期间发表的论文第83-84页
致谢第84页

论文共84页,点击 下载论文
上一篇:基于加权信息熵相似度的协同过滤算法研究
下一篇:县级电视台在县域经济发展中的媒体责任研究--以《武进新闻》的报道现状为例