统计和规则相结合的新闻网页分类系统的设计与实现

摘要	第1-5页
ABSTRACT	第5-10页
第一章绪论	第10-17页
·研究背景	第10-11页
·研究意义	第11-12页
·信息检索	第11页
·信息过滤	第11-12页
·词义消歧	第12页
·研究现状	第12-15页
·国外研究现状	第12-14页
·国内研究现状	第14-15页
·研究内容与论文组织	第15-17页
第二章文本分类的相关理论研究	第17-34页
·文本分类的问题描述	第17-18页
·文本分类的定义	第17页
·文本分类的模型	第17-18页
·中文自动分词技术	第18-20页
·自动分词算法	第18-19页
·中文分词面临的困难	第19-20页
·文本分类的实现过程	第20-26页
·文本预处理	第20-21页
·文本的表示	第21-22页
·特征的选取	第22-26页
·文本分类的算法	第26-31页
·基于统计的方法	第26-30页
·基于规则的方法	第30-31页
·文本分类的评价指标	第31-33页
·评价方法	第31-33页
·评价标准	第33页
·本章小结	第33-34页
第三章系统的概要设计	第34-50页
·系统总体设计	第34-35页
·新闻网页结构特点分析	第35-39页
·新闻网页的结构	第35-36页
·新闻网页的特点	第36-39页
·标签不规范情况的分析	第39页
·系统需求描述	第39-41页
·功能性需求	第39-41页
·非功能性需求	第41页
·功能模块的概要设计	第41-49页
·类别特征词抽取模块	第41-43页
·标签不规范网页处理	第43-45页
·新闻网页的内容抽取	第45-48页
·新闻网页的特征词集	第48-49页
·语义距离的计算方法	第49页
·本章小结	第49-50页
第四章系统的详细设计	第50-56页
·类别特征词的抽取	第50-51页
·新闻网页信息抽取	第51-53页
·正文信息的抽取	第51页
·标题的抽取	第51-52页
·超链接的抽取	第52-53页
·语义距离类图设计	第53页
·分类辅助规则设计	第53-54页
·网页分类模块设计	第54-55页
·本章小结	第55-56页
第五章系统的实现	第56-66页
·类别特征词的实现	第56-57页
·网页信息抽取实现	第57-61页
·正文信息的抽取	第57-59页
·标题的抽取	第59-60页
·超链接的抽取	第60-61页
·语义距离算法实现	第61-64页
·分类辅助规则实现	第64页
·网页分类模块实现	第64-65页
·本章小结	第65-66页
第六章系统的测试	第66-71页
·实验的环境	第66页
·系统的运行	第66-69页
·实验结果与分析	第69-71页
第七章总结与展望	第71-74页
·主要工作	第71页
·主要创新点	第71-72页
·进一步工作的方向	第72-74页
参考文献	第74-76页
致谢	第76-77页