基于主题模型的科技论文聚类推荐

摘要	第1-6页
Abstract	第6-9页
第1章绪论	第9-14页
·课题选题背景及意义	第9-11页
·推荐系统的发展现状	第11-13页
·本文主要内容及结构	第13-14页
第2章科技论文建模	第14-22页
·布尔检索模型	第14-15页
·空间向量模型	第15-16页
·隐性语义索引	第16-17页
·主题模型	第17-21页
·概率隐性语义分析	第18-20页
·潜在狄利克雷分配	第20-21页
·本章小结	第21-22页
第3章聚类和相似性度量	第22-28页
·聚类	第22-26页
·距离公式	第23-24页
·聚类算法	第24-25页
·聚类算法评价	第25-26页
·相似性计算	第26-27页
·基于Hash值的字符串匹配法	第26-27页
·基于词频统计的计算法	第27页
·本章小结	第27-28页
第4章基于主题模型的科技论文聚类推荐后端设计	第28-43页
·论文数据的来源	第28-32页
·爬取站点网页分析	第29-32页
·页面信息的正则抓取	第32页
·PDF链接的下载	第32-33页
·科技论文的预处理	第33-34页
·基于主题模型的科技论文聚类推荐算法	第34-42页
·文档集表示	第35-37页
·文档集聚类	第37页
·文档相似性度量	第37-38页
·实验结果和分析	第38-42页
·本章小结	第42-43页
第5章科技论文搜索的前端实现	第43-57页
·SPHINX搜索引擎	第43-49页
·倒排索引	第44-46页
·MMSEG分词	第46-48页
·排序算法	第48-49页
·站点搭建	第49-54页
·数据集的建立	第49-50页
·索引生成	第50-51页
·search服务开启	第51页
·Sphinx与网站前端接口	第51-54页
·WEB实现	第54-56页
·本章小结	第56-57页
第6章总结与展望	第57-58页
参考文献	第58-61页
攻读硕士学位期间发表的论文及其他成果	第61-62页
致谢	第62页