中文网页自动摘要系统的设计与实现

摘要	第1-6页
Abstract	第6-10页
第一章绪论	第10-17页
·选题依据	第10页
·国内外网页自动摘要的研究现状	第10-15页
·文本摘要技术概述	第10-11页
·网页自动摘要的过程	第11-13页
·国内外研究现状	第13-15页
·本文的工作及组织结构	第15-17页
第二章中文网页自动摘要技术	第17-26页
·网页去噪	第17-18页
·噪声来源	第17页
·噪音去除方法	第17-18页
·中文分词	第18-19页
·基于字符串匹配的分词方法	第18-19页
·基于理解的分词方法	第19页
·基于统计的分词方法	第19页
·自动摘要的主要方法	第19-23页
·自动摘要	第20页
·基于理解的自动摘要	第20-21页
·信息抽取	第21-23页
·基于结构的自动摘要	第23页
·摘要系统质量评价方法	第23-25页
·内部评价	第24-25页
·外部评价	第25页
·本章小结	第25-26页
第三章中文网页自动摘要系统的设计	第26-39页
·设计原则	第27-28页
·设计目标	第28页
·系统总体架构设计	第28-29页
·网页预处理	第29-33页
·网页去噪	第31-33页
·网页类型分类	第31页
·改进的CTPVS 网页分块算法	第31-33页
·句子的划分	第33页
·网页摘要抽取	第33-37页
·句子权重特征的选取和合成	第34-35页
·查询相关权重特征	第35-36页
·线索词权重特征	第36页
·TF-IDF权重特征	第36-37页
·位置权重特征	第37页
·小结	第37-39页
第四章中文网页自动摘要系统的实现	第39-50页
·Nutch上的二次开发	第39-41页
·信息源选择及规范制定	第39页
·信息预处理	第39-40页
·索引本土化构建	第40页
·排序规则制定	第40-41页
·查询系统及用户界面	第41页
·正文的提取	第41-45页
·提取正文的过程	第41-42页
·DOM树的处理	第42-43页
·正文提取结果	第43-45页
·摘要的抽取	第45-49页
·句子的划分	第46-47页
·中文分词	第47-49页
·摘要抽取结果	第49页
·本章小结	第49-50页
第五章中文网页自动摘要系统的评价	第50-61页
·实验方法	第50-54页
·现状	第50页
·Pyramid方法	第50-52页
·改进的Pyramid方法	第52-54页
·实验数据	第54-56页
·数据来源分析	第54-55页
·数据的获取	第55-56页
·实验结果	第56-60页
·去噪前后实验对比结果	第56-57页
·句子权重比例的选取	第57-58页
·与其他系统的实验对比结果	第58-59页
·系统的性能测试	第59-60页
·本章小结	第60-61页
结论	第61-62页
参考文献	第62-65页
攻读硕士学位期间取得的研究成果	第65-66页
致谢	第66页