首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

统计和规则相结合的新闻网页分类系统的设计与实现

摘要第1-5页
ABSTRACT第5-10页
第一章 绪论第10-17页
   ·研究背景第10-11页
   ·研究意义第11-12页
     ·信息检索第11页
     ·信息过滤第11-12页
     ·词义消歧第12页
   ·研究现状第12-15页
     ·国外研究现状第12-14页
     ·国内研究现状第14-15页
   ·研究内容与论文组织第15-17页
第二章 文本分类的相关理论研究第17-34页
   ·文本分类的问题描述第17-18页
     ·文本分类的定义第17页
     ·文本分类的模型第17-18页
   ·中文自动分词技术第18-20页
     ·自动分词算法第18-19页
     ·中文分词面临的困难第19-20页
   ·文本分类的实现过程第20-26页
     ·文本预处理第20-21页
     ·文本的表示第21-22页
     ·特征的选取第22-26页
   ·文本分类的算法第26-31页
     ·基于统计的方法第26-30页
     ·基于规则的方法第30-31页
   ·文本分类的评价指标第31-33页
     ·评价方法第31-33页
     ·评价标准第33页
   ·本章小结第33-34页
第三章 系统的概要设计第34-50页
   ·系统总体设计第34-35页
   ·新闻网页结构特点分析第35-39页
     ·新闻网页的结构第35-36页
     ·新闻网页的特点第36-39页
     ·标签不规范情况的分析第39页
   ·系统需求描述第39-41页
     ·功能性需求第39-41页
     ·非功能性需求第41页
   ·功能模块的概要设计第41-49页
     ·类别特征词抽取模块第41-43页
     ·标签不规范网页处理第43-45页
     ·新闻网页的内容抽取第45-48页
     ·新闻网页的特征词集第48-49页
     ·语义距离的计算方法第49页
   ·本章小结第49-50页
第四章 系统的详细设计第50-56页
   ·类别特征词的抽取第50-51页
   ·新闻网页信息抽取第51-53页
     ·正文信息的抽取第51页
     ·标题的抽取第51-52页
     ·超链接的抽取第52-53页
   ·语义距离类图设计第53页
   ·分类辅助规则设计第53-54页
   ·网页分类模块设计第54-55页
   ·本章小结第55-56页
第五章 系统的实现第56-66页
   ·类别特征词的实现第56-57页
   ·网页信息抽取实现第57-61页
     ·正文信息的抽取第57-59页
     ·标题的抽取第59-60页
     ·超链接的抽取第60-61页
   ·语义距离算法实现第61-64页
   ·分类辅助规则实现第64页
   ·网页分类模块实现第64-65页
   ·本章小结第65-66页
第六章 系统的测试第66-71页
   ·实验的环境第66页
   ·系统的运行第66-69页
   ·实验结果与分析第69-71页
第七章 总结与展望第71-74页
   ·主要工作第71页
   ·主要创新点第71-72页
   ·进一步工作的方向第72-74页
参考文献第74-76页
致谢第76-77页

论文共77页,点击 下载论文
上一篇:基于PKI的网络安全技术平台的设计与实现
下一篇:网格技术在校园网中的设计与实现