第一章 引言 | 第1-10页 |
·项目开发背景 | 第8页 |
·信息技术的发展 | 第8页 |
·信息检索技术的热点 | 第8-9页 |
·本文的研究内容 | 第9-10页 |
第二章 系统框架结构 | 第10-11页 |
·中国物流中心信息检索系统结构 | 第10页 |
·算法介入模块 | 第10-11页 |
第三章 Robot搜索引擎 | 第11-18页 |
·Robot的排除标准(Robot Exclusion Standard) | 第11-13页 |
·Robot的评价标准 | 第13-14页 |
·Robot的搜索策略 | 第14-16页 |
·Robot引擎模块的搜索算法设计 | 第16-17页 |
·Robot的更新策略 | 第17-18页 |
第四章 Web信息发现和分类技术 | 第18-30页 |
·网页信息预处理技术 | 第18-19页 |
·普通文档的信息预处理 | 第18页 |
·超文本标记预处理 | 第18-19页 |
·向量空间模型(VSM) | 第19-20页 |
·文档权重的计算 | 第20-21页 |
·聚类算法基础 | 第21-30页 |
·类间距离的定义 | 第22-25页 |
·类的定义 | 第22-23页 |
·类间距离的定义 | 第23-25页 |
·聚类算法 | 第25-30页 |
·聚类步骤 | 第25-26页 |
·聚类谱系图 | 第26-27页 |
·常用聚类算法 | 第27-30页 |
第五章 中文分词技术 | 第30-37页 |
·中文分词对搜索引擎的影响 | 第30页 |
·中文分词技术 | 第30-32页 |
·分词模块的算法设计 | 第32-35页 |
·试验结果与分析 | 第35-37页 |
第六章 Web分类模块的算法设计 | 第37-42页 |
·网页信息分析 | 第37-39页 |
·网页结构分析 | 第37页 |
·网页控制符分析 | 第37-39页 |
·网页信息提取 | 第39页 |
·预处理 | 第39-40页 |
·中文分词 | 第39页 |
·特征项提取 | 第39-40页 |
·权值计算 | 第40页 |
·特征向量的缩减 | 第40页 |
·分类算法 | 第40-42页 |
第七章 论文总结 | 第42-43页 |
致谢 | 第43-44页 |
参考文献 | 第44页 |