基于Web的文本挖掘技术的研究
| 第1章 绪论 | 第1-21页 |
| ·研究课题的来源、目的和意义 | 第10页 |
| ·我们所期待的信息服务 | 第10-13页 |
| ·Web挖掘的起源 | 第13页 |
| ·Web挖掘的定义 | 第13-14页 |
| ·Web挖掘与Web信息检索 | 第14-16页 |
| ·Web信息检索的定义 | 第14页 |
| ·两者之间的关系 | 第14-16页 |
| ·Web挖掘研究方向 | 第16-19页 |
| ·Web文本挖掘 | 第17-18页 |
| ·Web结构挖掘 | 第18-19页 |
| ·Web使用记录挖掘 | 第19页 |
| ·本章小结 | 第19-21页 |
| 第2章 Web文本挖掘系统的设计 | 第21-29页 |
| ·Web的数据模型 | 第21-22页 |
| ·Web文本挖掘方法 | 第22-26页 |
| ·文本的特征表示 | 第22页 |
| ·文本分类 | 第22-24页 |
| ·文本聚类 | 第24-26页 |
| ·Web文本挖掘系统的设计 | 第26-28页 |
| ·系统组件 | 第26-27页 |
| ·系统行为 | 第27-28页 |
| ·本章小结 | 第28-29页 |
| 第3章 Web文档采集及预处理 | 第29-40页 |
| ·Web文档采集器的设计 | 第29-33页 |
| ·HTTP简介 | 第29-30页 |
| ·总体设计思想 | 第30-33页 |
| ·文档的预处理 | 第33-39页 |
| ·特征选择 | 第33-34页 |
| ·TFIDF向量表示法 | 第34-37页 |
| ·特征子集的选取 | 第37-39页 |
| ·本章小结 | 第39-40页 |
| 第4章 遗传算法分析 | 第40-52页 |
| ·遗传算法概述 | 第40-41页 |
| ·基本遗传算法 | 第41-44页 |
| ·基本遗传算法的构成要素 | 第42-43页 |
| ·基本遗传算法的一般框架 | 第43-44页 |
| ·遗传算法的数学理论 | 第44-47页 |
| ·模式定理 | 第44-47页 |
| ·遗传算法的基本实现技术 | 第47-51页 |
| ·编码方法 | 第47-48页 |
| ·适应度函数 | 第48页 |
| ·选择算子 | 第48-49页 |
| ·交叉算子 | 第49页 |
| ·变异算子 | 第49-50页 |
| ·约束条件的处理方法 | 第50-51页 |
| ·本章小结 | 第51-52页 |
| 第5章 基于遗传算法的Web文档特征获取算法 | 第52-60页 |
| ·Web挖掘与文档表示 | 第52-54页 |
| ·文档的表示 | 第52-53页 |
| ·特征提取问题 | 第53-54页 |
| ·基于遗传算法的特征提取算法 | 第54-58页 |
| ·特征词的选择 | 第55-56页 |
| ·遗传编码 | 第56页 |
| ·遗传操作 | 第56-57页 |
| ·评价函数 | 第57-58页 |
| ·算法分析 | 第58-59页 |
| ·主要评价指标 | 第58-59页 |
| ·实验结果 | 第59页 |
| ·本章小结 | 第59-60页 |
| 结论 | 第60-62页 |
| 参考文献 | 第62-65页 |
| 攻读硕士学位期间发表的论文和取得的科研成果 | 第65-66页 |
| 致谢 | 第66页 |