基于网页特征的中文网页自动分类问题研究

摘要	第1-6页
Abstract	第6-7页
致谢	第7-12页
第一章绪论	第12-17页
·数据挖掘	第12-13页
·数据挖掘的概念	第12页
·数据挖掘的模型与算法	第12-13页
·Web挖掘技术研究	第13-15页
·Web挖掘的定义	第13-14页
·Web挖掘的分类	第14-15页
·本文的研究内容及组织结构	第15-16页
·本章小结	第16-17页
第二章网页分类技术	第17-27页
·网页分类的意义	第17页
·网页分类的国内外研究现状	第17-18页
·中文网页分类关键技术	第18-25页
·训练样本集	第18-19页
·网页的表示模型	第19-21页
·特征项提取	第21-22页
·分类器的设计	第22-25页
·中文网页分类技术的难点及突出问题	第25-26页
·本章小结	第26-27页
第三章新闻网页自动识别的相关特征研究	第27-34页
·引言	第27页
·新闻网页识别的相关特征	第27-30页
·新闻网页的URL特征	第27-28页
·新闻网页的结构特征	第28-29页
·新闻网页的内容特征	第29-30页
·面向新闻网页识别的特征集合	第30页
·新闻网页自动识别方法	第30页
·实验及分析	第30-33页
·实验结果	第31-32页
·实验分析	第32-33页
·本章小结	第33-34页
第四章基于网页特征的中文网页自动分类研究	第34-50页
·引言	第34-35页
·中文网页自动分类的任务	第35页
·中文网页自动分类的系统模块	第35-36页
·基于网页特征的中文网页自动分类方法	第36-44页
·中文网页的自动分类方法	第36页
·中文网页的特征分析	第36-38页
·中文网页信息的预处理及特征抽取	第38-41页
·中文网页的链接特征	第41-43页
·中文网页的内容特征	第43-44页
·实验结果及分析	第44-49页
·实验结果	第44-47页
·实验分析	第47-49页
·本章小结	第49-50页
第五章面向主题搜索引擎设计与实现	第50-55页
·引言	第50页
·面向主题搜索引擎模块介绍及系统结构	第50-52页
·主题确立模块	第50页
·初始种子模块	第50页
·爬行模块和主题相关度分析模块	第50-51页
·系统结构图	第51-52页
·面向主题搜索引擎系统介绍	第52-54页
·面向主题搜索引擎系统数据库设计	第52页
·面向主题搜索引擎系统用户查询界面	第52-53页
·面向主题搜索引擎系统查询结果界面	第53-54页
·面向主题搜索引擎系统查询结果分析	第54页
·本章小结	第54-55页
第六章总结与展望	第55-57页
·工作总结	第55-56页
·工作展望	第56-57页
参考文献	第57-61页
附录一研究生期间主要科研工作及成果	第61页