摘要 | 第1-5页 |
Abstract | 第5-7页 |
目录 | 第7-9页 |
第一章 绪论 | 第9-11页 |
·论文研究背景与意义 | 第9页 |
·论文研究内容与组织结构 | 第9-11页 |
第二章 无词典分词算法研究 | 第11-22页 |
·概述 | 第11页 |
·基于后缀数组的无词典分词算法简介 | 第11-13页 |
·数据结构 | 第11-12页 |
·算法 | 第12-13页 |
·对以上算法的分析及改进 | 第13-18页 |
·取候选词集算法分析及改进 | 第13-15页 |
·筛选候选词集算法分析及改进 | 第15-18页 |
·实验结果及分析 | 第18-22页 |
·取候选词集算法和改进后的取候选词集算法实验结果对比 | 第18-19页 |
·再次改进后的取候选词集算法改进效果实验分析 | 第19-22页 |
第三章 中文分词词典机制的研究 | 第22-38页 |
·概述 | 第22页 |
·三种典型的中文分词词典机制 | 第22-26页 |
·基于PATRICIA tree的中文分词词典机制 | 第26-32页 |
·数据结构 | 第26-27页 |
·数据运算 | 第27-28页 |
·性能分析 | 第28-29页 |
·对PATRICIA tree运算的改进 | 第29-32页 |
·双字哈希-词尾PATRICIA tree机制 | 第32-38页 |
·数据结构 | 第33-35页 |
·数据运算 | 第35-36页 |
·性能分析 | 第36-38页 |
第四章 挖掘竞争对手网站的商业情报 | 第38-50页 |
·概述 | 第38-39页 |
·挖掘方法简介 | 第39-40页 |
·意外信息的定义 | 第39页 |
·所提供的挖掘方法概述 | 第39-40页 |
·向量空间表示法 | 第40-41页 |
·挖掘中所使用的几种比较方法 | 第41-45页 |
·针对一个用户页面寻找与之相类似的竞争对手页面 | 第41-42页 |
·在一个竞争对手页面中寻找关于用户页面的意外关键词 | 第42-43页 |
·在竞争对手中寻找关于用户的意外页面 | 第43-44页 |
·在一个竞争对手页面中寻找关于一个用户页面的意外概念 | 第44-45页 |
·挖掘意外的超链接 | 第45页 |
·将用户已有的知识加入到挖掘系统中 | 第45-46页 |
·实验 | 第46-50页 |
·实验步骤 | 第46-48页 |
·实验结果及分析 | 第48-50页 |
第五章 总结与展望 | 第50-52页 |
·总结 | 第50页 |
·展望 | 第50-52页 |
参考文献 | 第52-55页 |
表索引 | 第55-56页 |
Table Index | 第56-57页 |
图索引 | 第57-58页 |
Figure Index | 第58-59页 |
致谢 | 第59-60页 |
攻读学位期间发表的学术论文目录 | 第60页 |