竞争对手网站商业情报挖掘

摘要	第1-5页
Abstract	第5-7页
目录	第7-9页
第一章绪论	第9-11页
·论文研究背景与意义	第9页
·论文研究内容与组织结构	第9-11页
第二章无词典分词算法研究	第11-22页
·概述	第11页
·基于后缀数组的无词典分词算法简介	第11-13页
·数据结构	第11-12页
·算法	第12-13页
·对以上算法的分析及改进	第13-18页
·取候选词集算法分析及改进	第13-15页
·筛选候选词集算法分析及改进	第15-18页
·实验结果及分析	第18-22页
·取候选词集算法和改进后的取候选词集算法实验结果对比	第18-19页
·再次改进后的取候选词集算法改进效果实验分析	第19-22页
第三章中文分词词典机制的研究	第22-38页
·概述	第22页
·三种典型的中文分词词典机制	第22-26页
·基于PATRICIA tree的中文分词词典机制	第26-32页
·数据结构	第26-27页
·数据运算	第27-28页
·性能分析	第28-29页
·对PATRICIA tree运算的改进	第29-32页
·双字哈希-词尾PATRICIA tree机制	第32-38页
·数据结构	第33-35页
·数据运算	第35-36页
·性能分析	第36-38页
第四章挖掘竞争对手网站的商业情报	第38-50页
·概述	第38-39页
·挖掘方法简介	第39-40页
·意外信息的定义	第39页
·所提供的挖掘方法概述	第39-40页
·向量空间表示法	第40-41页
·挖掘中所使用的几种比较方法	第41-45页
·针对一个用户页面寻找与之相类似的竞争对手页面	第41-42页
·在一个竞争对手页面中寻找关于用户页面的意外关键词	第42-43页
·在竞争对手中寻找关于用户的意外页面	第43-44页
·在一个竞争对手页面中寻找关于一个用户页面的意外概念	第44-45页
·挖掘意外的超链接	第45页
·将用户已有的知识加入到挖掘系统中	第45-46页
·实验	第46-50页
·实验步骤	第46-48页
·实验结果及分析	第48-50页
第五章总结与展望	第50-52页
·总结	第50页
·展望	第50-52页
参考文献	第52-55页
表索引	第55-56页
Table Index	第56-57页
图索引	第57-58页
Figure Index	第58-59页
致谢	第59-60页
攻读学位期间发表的学术论文目录	第60页