基于中文科技文献关键词的聚类系统的设计与实现

摘要	第1-5页
ABSTRACT	第5-9页
第一章绪论	第9-15页
·引言	第9-10页
·论文项目背景	第10页
·文献检索技术介绍	第10-11页
·文献检索技术研究现状	第11-13页
·本文的主要研究内容及工作	第13页
·论文组织结构	第13-15页
第二章网络爬虫技术研究	第15-23页
·网络爬虫技术	第15-18页
·网络爬虫技术的基本原理	第15页
·网络爬虫的主要模块和体系结构	第15-16页
·网络爬虫的分类	第16-18页
·聚焦网络爬虫介绍	第18-22页
·聚焦网络爬虫的产生背景	第18-19页
·聚焦网络爬虫的工作流程和体系结构	第19页
·聚焦网络爬虫的关键技术	第19-22页
·本章小结	第22-23页
第三章词聚类相关技术介绍	第23-38页
·词聚类技术	第23-26页
·词聚类介绍	第23-24页
·中文词聚类	第24-25页
·概念聚类	第25-26页
·FCM算法介绍	第26-28页
·FCM算法原理介绍	第26-28页
·FCM算法分析	第28页
·原子词和原子概念	第28-32页
·领域词语	第28-31页
·原子词和原子概念	第31-32页
·MATLAB中FCM的使用介绍	第32-36页
·本章小结	第36-38页
第四章实验系统的设计与实现	第38-48页
·系统的基本设计思想与设计目标	第38页
·实验系统的体系结构与具体研究步骤	第38-40页
·网络爬虫模块设计	第40-44页
·数据抓取部分设计	第41-43页
·页面内容处理模块设计	第43-44页
·词聚类模块设计	第44-47页
·词语的预处理	第45页
·选取原子词和原子概念	第45-46页
·计算相似度	第46页
·利用VSM模型构建聚类空间	第46-47页
·本章小结	第47-48页
第五章系统测试与结果分析	第48-59页
·系统的开发及运行环境	第48页
·实验数据展示	第48-54页
·网络爬虫获取的数据展示	第48-51页
·预处理后数据展示	第51页
·原子词和原子概念	第51-54页
·实验结果展示与分析	第54-58页
·相似度矩阵	第54页
·MATLAB聚类结果及分析	第54-57页
·聚类时间复杂度分析	第57-58页
·本章小结	第58-59页
第六章总结与展望	第59-61页
·工作总结	第59-60页
·需要改进的地方	第60-61页
参考文献	第61-64页
致谢	第64-65页
攻读硕士学位期间发表的学术论文	第65页