基于Web的文本挖掘技术的研究
第1章 绪论 | 第1-21页 |
·研究课题的来源、目的和意义 | 第10页 |
·我们所期待的信息服务 | 第10-13页 |
·Web挖掘的起源 | 第13页 |
·Web挖掘的定义 | 第13-14页 |
·Web挖掘与Web信息检索 | 第14-16页 |
·Web信息检索的定义 | 第14页 |
·两者之间的关系 | 第14-16页 |
·Web挖掘研究方向 | 第16-19页 |
·Web文本挖掘 | 第17-18页 |
·Web结构挖掘 | 第18-19页 |
·Web使用记录挖掘 | 第19页 |
·本章小结 | 第19-21页 |
第2章 Web文本挖掘系统的设计 | 第21-29页 |
·Web的数据模型 | 第21-22页 |
·Web文本挖掘方法 | 第22-26页 |
·文本的特征表示 | 第22页 |
·文本分类 | 第22-24页 |
·文本聚类 | 第24-26页 |
·Web文本挖掘系统的设计 | 第26-28页 |
·系统组件 | 第26-27页 |
·系统行为 | 第27-28页 |
·本章小结 | 第28-29页 |
第3章 Web文档采集及预处理 | 第29-40页 |
·Web文档采集器的设计 | 第29-33页 |
·HTTP简介 | 第29-30页 |
·总体设计思想 | 第30-33页 |
·文档的预处理 | 第33-39页 |
·特征选择 | 第33-34页 |
·TFIDF向量表示法 | 第34-37页 |
·特征子集的选取 | 第37-39页 |
·本章小结 | 第39-40页 |
第4章 遗传算法分析 | 第40-52页 |
·遗传算法概述 | 第40-41页 |
·基本遗传算法 | 第41-44页 |
·基本遗传算法的构成要素 | 第42-43页 |
·基本遗传算法的一般框架 | 第43-44页 |
·遗传算法的数学理论 | 第44-47页 |
·模式定理 | 第44-47页 |
·遗传算法的基本实现技术 | 第47-51页 |
·编码方法 | 第47-48页 |
·适应度函数 | 第48页 |
·选择算子 | 第48-49页 |
·交叉算子 | 第49页 |
·变异算子 | 第49-50页 |
·约束条件的处理方法 | 第50-51页 |
·本章小结 | 第51-52页 |
第5章 基于遗传算法的Web文档特征获取算法 | 第52-60页 |
·Web挖掘与文档表示 | 第52-54页 |
·文档的表示 | 第52-53页 |
·特征提取问题 | 第53-54页 |
·基于遗传算法的特征提取算法 | 第54-58页 |
·特征词的选择 | 第55-56页 |
·遗传编码 | 第56页 |
·遗传操作 | 第56-57页 |
·评价函数 | 第57-58页 |
·算法分析 | 第58-59页 |
·主要评价指标 | 第58-59页 |
·实验结果 | 第59页 |
·本章小结 | 第59-60页 |
结论 | 第60-62页 |
参考文献 | 第62-65页 |
攻读硕士学位期间发表的论文和取得的科研成果 | 第65-66页 |
致谢 | 第66页 |