企业信息垂直搜索引擎的研究与实现

摘要	第1-6页
ABSTRACT	第6-9页
第一章绪论	第9-18页
·研究背景和意义	第9-10页
·研究背景	第9-10页
·研究意义	第10页
·研究现状	第10-16页
·垂直搜索与企业搜索、互联网搜索的区别	第11-13页
·垂直搜索引擎的优势分析	第13页
·垂直搜索引擎面临的问题	第13-15页
·促进垂直搜索引擎发展的对策	第15-16页
·论文组织结构	第16-18页
第二章垂直搜索引擎的总体设计	第18-23页
·系统总体设计	第18-20页
·系统功能结构	第20-21页
·网页采集功能	第20页
·索引功能	第20页
·搜索功能	第20-21页
·用户管理	第21页
·系统用例分析	第21-22页
·角色定义	第21页
·用例分析	第21-22页
·本章小结	第22-23页
第三章中文分词和VSM 算法	第23-33页
·分词技术背景	第23-25页
·基于字符串匹配的分词方法	第23-24页
·基于理解的分词方法	第24页
·基于统计的分词方法	第24-25页
·中文分词难点	第25页
·中科院的分词词典技术	第25-28页
·VSM 简单介绍	第28-32页
·本章小结	第32-33页
第四章系统的详细设计	第33-50页
·主题爬虫	第33-38页
·主题爬虫基本流程	第33-34页
·页面中链接提取	第34-36页
·种子页面的选取	第36页
·主题爬虫爬行方式	第36-37页
·主题爬虫搜索策略	第37页
·主题爬虫学习方式	第37-38页
·文本信息抽取	第38-44页
·HTML 简介	第39页
·页面信息抽取对象	第39-40页
·页面信息抽取规则	第40-42页
·HTML 信息分析	第42-43页
·相似度的确定	第43-44页
·建立索引数据库	第44-46页
·页面的排序	第46-48页
·排序算法说明	第46-47页
·系统中的网页排序	第47-48页
·本章小结	第48-50页
第五章系统的具体实现	第50-60页
·数据库的设计	第50-54页
·系统功能模块的实现	第54-59页
·网络爬虫的实现	第54-56页
·数据库的操作	第56页
·用户信息管理	第56-58页
·数据管理	第58-59页
·用户检索的实现	第59页
·本章小结	第59-60页
第六章结论	第60-61页
致谢	第61-62页
参考文献	第62-63页
在攻读硕士研究生期间发表的论文	第63-64页
个人简历	第64页