首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

中文网页自动摘要系统的设计与实现

摘要第1-6页
Abstract第6-10页
第一章 绪论第10-17页
   ·选题依据第10页
   ·国内外网页自动摘要的研究现状第10-15页
     ·文本摘要技术概述第10-11页
     ·网页自动摘要的过程第11-13页
     ·国内外研究现状第13-15页
   ·本文的工作及组织结构第15-17页
第二章 中文网页自动摘要技术第17-26页
   ·网页去噪第17-18页
     ·噪声来源第17页
     ·噪音去除方法第17-18页
   ·中文分词第18-19页
     ·基于字符串匹配的分词方法第18-19页
     ·基于理解的分词方法第19页
     ·基于统计的分词方法第19页
   ·自动摘要的主要方法第19-23页
     ·自动摘要第20页
     ·基于理解的自动摘要第20-21页
     ·信息抽取第21-23页
     ·基于结构的自动摘要第23页
   ·摘要系统质量评价方法第23-25页
     ·内部评价第24-25页
     ·外部评价第25页
   ·本章小结第25-26页
第三章 中文网页自动摘要系统的设计第26-39页
   ·设计原则第27-28页
   ·设计目标第28页
   ·系统总体架构设计第28-29页
   ·网页预处理第29-33页
     ·网页去噪第31-33页
       ·网页类型分类第31页
       ·改进的CTPVS 网页分块算法第31-33页
     ·句子的划分第33页
   ·网页摘要抽取第33-37页
     ·句子权重特征的选取和合成第34-35页
     ·查询相关权重特征第35-36页
     ·线索词权重特征第36页
     ·TF-IDF权重特征第36-37页
     ·位置权重特征第37页
   ·小结第37-39页
第四章 中文网页自动摘要系统的实现第39-50页
   ·Nutch上的二次开发第39-41页
     ·信息源选择及规范制定第39页
     ·信息预处理第39-40页
     ·索引本土化构建第40页
     ·排序规则制定第40-41页
     ·查询系统及用户界面第41页
   ·正文的提取第41-45页
     ·提取正文的过程第41-42页
     ·DOM树的处理第42-43页
     ·正文提取结果第43-45页
   ·摘要的抽取第45-49页
     ·句子的划分第46-47页
     ·中文分词第47-49页
     ·摘要抽取结果第49页
   ·本章小结第49-50页
第五章 中文网页自动摘要系统的评价第50-61页
   ·实验方法第50-54页
     ·现状第50页
     ·Pyramid方法第50-52页
     ·改进的Pyramid方法第52-54页
   ·实验数据第54-56页
     ·数据来源分析第54-55页
     ·数据的获取第55-56页
   ·实验结果第56-60页
     ·去噪前后实验对比结果第56-57页
     ·句子权重比例的选取第57-58页
     ·与其他系统的实验对比结果第58-59页
     ·系统的性能测试第59-60页
   ·本章小结第60-61页
结论第61-62页
参考文献第62-65页
攻读硕士学位期间取得的研究成果第65-66页
致谢第66页

论文共66页,点击 下载论文
上一篇:外贸企业咨询服务热线系统
下一篇:实时网页游戏服务器端架构的设计与实现