基于主题模型的科技论文聚类推荐
| 摘要 | 第1-6页 |
| Abstract | 第6-9页 |
| 第1章 绪论 | 第9-14页 |
| ·课题选题背景及意义 | 第9-11页 |
| ·推荐系统的发展现状 | 第11-13页 |
| ·本文主要内容及结构 | 第13-14页 |
| 第2章 科技论文建模 | 第14-22页 |
| ·布尔检索模型 | 第14-15页 |
| ·空间向量模型 | 第15-16页 |
| ·隐性语义索引 | 第16-17页 |
| ·主题模型 | 第17-21页 |
| ·概率隐性语义分析 | 第18-20页 |
| ·潜在狄利克雷分配 | 第20-21页 |
| ·本章小结 | 第21-22页 |
| 第3章 聚类和相似性度量 | 第22-28页 |
| ·聚类 | 第22-26页 |
| ·距离公式 | 第23-24页 |
| ·聚类算法 | 第24-25页 |
| ·聚类算法评价 | 第25-26页 |
| ·相似性计算 | 第26-27页 |
| ·基于Hash值的字符串匹配法 | 第26-27页 |
| ·基于词频统计的计算法 | 第27页 |
| ·本章小结 | 第27-28页 |
| 第4章 基于主题模型的科技论文聚类推荐后端设计 | 第28-43页 |
| ·论文数据的来源 | 第28-32页 |
| ·爬取站点网页分析 | 第29-32页 |
| ·页面信息的正则抓取 | 第32页 |
| ·PDF链接的下载 | 第32-33页 |
| ·科技论文的预处理 | 第33-34页 |
| ·基于主题模型的科技论文聚类推荐算法 | 第34-42页 |
| ·文档集表示 | 第35-37页 |
| ·文档集聚类 | 第37页 |
| ·文档相似性度量 | 第37-38页 |
| ·实验结果和分析 | 第38-42页 |
| ·本章小结 | 第42-43页 |
| 第5章 科技论文搜索的前端实现 | 第43-57页 |
| ·SPHINX搜索引擎 | 第43-49页 |
| ·倒排索引 | 第44-46页 |
| ·MMSEG分词 | 第46-48页 |
| ·排序算法 | 第48-49页 |
| ·站点搭建 | 第49-54页 |
| ·数据集的建立 | 第49-50页 |
| ·索引生成 | 第50-51页 |
| ·search服务开启 | 第51页 |
| ·Sphinx与网站前端接口 | 第51-54页 |
| ·WEB实现 | 第54-56页 |
| ·本章小结 | 第56-57页 |
| 第6章 总结与展望 | 第57-58页 |
| 参考文献 | 第58-61页 |
| 攻读硕士学位期间发表的论文及其他成果 | 第61-62页 |
| 致谢 | 第62页 |