第一章 绪论 | 第1-24页 |
·引言 | 第9-10页 |
·课题的研究背景与意义 | 第10-16页 |
·Web文本信息挖掘的难点 | 第13-14页 |
·Web文本信息挖掘中的关键技术 | 第14-16页 |
·相关技术与国内外研究现状 | 第16-21页 |
·目前国外的研究现状 | 第17-18页 |
·目前国内的研究现状 | 第18-21页 |
·本课题研究的内容及工作 | 第21-23页 |
·论文大纲 | 第23-24页 |
第二章 搜索引擎 | 第24-39页 |
·综述 | 第24-25页 |
·搜索引擎基本构成及采用技术 | 第25-28页 |
·搜索引擎的分类及其工作原理 | 第28-33页 |
·搜索引擎的分类 | 第28-31页 |
·搜索引擎的工作原理 | 第31-33页 |
·搜索引擎的主要指标 | 第33-34页 |
·现有搜索引擎的不足和缺点 | 第34-36页 |
·搜索引擎的未来发展趋势 | 第36-39页 |
第三章 Web文本挖掘及其技术 | 第39-54页 |
·文本挖掘的起源和主要任务 | 第39-41页 |
·Web文本挖掘的过程及其任务 | 第41-45页 |
·Web文本挖掘与Web信息检索的区别 | 第45-46页 |
·中文分词技术 | 第46-50页 |
·中文分词及其方法 | 第46-48页 |
·中文分词技术的现状 | 第48-49页 |
·中文分词的难点及其处理方法 | 第49-50页 |
·系统的文档建模 | 第50-54页 |
第四章 文本分类 | 第54-68页 |
·文本分类的定义和应用 | 第55页 |
·文本分类的方法 | 第55-60页 |
·合理分类的前提 | 第60-61页 |
·文本分类的过程 | 第61-62页 |
·分类器 | 第62-64页 |
·概念 | 第62-63页 |
·分类器的类型 | 第63-64页 |
·文档相似度计算 | 第64-65页 |
·分类器的准确度评估方法 | 第65-66页 |
·文本分类的评估指标 | 第66-68页 |
第五章 基于特定领域的Web文本信息获取系统的设计 | 第68-76页 |
·系统的结构框架 | 第68-69页 |
·系统的模块组成及其功能划分 | 第69-73页 |
·分类器的选择及训练 | 第73-74页 |
·特征项集的构造及其原则 | 第74-76页 |
第六章 总结与展望 | 第76-79页 |
·工作总结 | 第76-77页 |
·进一步研究的方向 | 第77-79页 |
参考文献 | 第79-83页 |
致谢 | 第83-84页 |
攻读学位期间发表的学术论文和取得的科研成果 | 第84页 |