文本挖掘的研究及其在主题搜索引擎中的应用

摘要	第1-5页
ABSTRACT	第5-10页
第一章绪论	第10-13页
·研究背景与意义	第10-11页
·国内外研究现状	第11页
·主要研究工作与成果	第11-12页
·论文的结构	第12-13页
第二章 WEB文本信息抽取技术研究	第13-23页
·网页的结构和内容	第13-15页
·网页的基本结构	第13-14页
·网页的内容特点	第14-15页
·网页预处理	第15-17页
·网页的标准化处理	第15-16页
·噪音信息的初步过滤	第16-17页
·网页内容提取	第17-22页
·DOM文档对象模型	第17-19页
·基于DOM的网页内容提取	第19-22页
·本章小结	第22-23页
第三章文本分类技术研究	第23-42页
·文本分类的基本知识	第23-24页
·文本分类的概念	第23页
·文本分类的过程	第23-24页
·文本表示模型	第24-26页
·布尔模型	第25页
·向量空间模型	第25-26页
·文本特征选择	第26-30页
·文档频率	第27页
·信息增益	第27-28页
·CHI统计法	第28-29页
·信息	第29-30页
·文本分类算法	第30-36页
·中心向量法	第30-31页
·朴素贝叶斯方法	第31页
·KNN方法	第31-32页
·支持向量机	第32-36页
·文本分类实验与结果分析	第36-41页
·WEB文本分类实验平台	第36-39页
·WEB文本分类实验结果	第39-41页
·本章小结	第41-42页
第四章文本聚类技术研究	第42-56页
·文本聚类的基本知识	第42-43页
·文本聚类的概念	第42页
·文本聚类的过程	第42-43页
·文本聚类的特征选择	第43-49页
·基于词性分析的特征选择	第44-46页
·基于语义词典的特征选择	第46-49页
·文本聚类算法	第49-51页
·划分聚类算法	第49页
·层次聚类算法	第49-50页
·基于密度的聚类算法	第50页
·基于网格的聚类算法	第50-51页
·文本聚类实验与结果分析	第51-55页
·文本聚类实验平台	第51-53页
·文本聚类实验结果	第53-55页
·本章小结	第55-56页
第五章主题搜索引擎的文本挖掘应用	第56-66页
·主题搜索引擎	第56-58页
·主题搜索引擎文本挖掘需求	第58-61页
·主题搜索引擎文本挖掘实现	第61-65页
·正文抽取子模块	第61页
·属性信息抽取子模块	第61-62页
·行业分类子模块	第62-65页
·本章小结	第65-66页
第六章总结	第66-68页
·全文总结	第66-67页
·不足和展望	第67-68页
参考文献	第68-70页
致谢	第70页