首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

新闻网页摘要算法的研究及实现

摘要第5-6页
abstract第6页
第1章 绪论第10-15页
    1.1 研究背景与意义第10-11页
    1.2 国内外研究现状第11-13页
        1.2.1 国外自动摘要研究第11-12页
        1.2.2 国内自动摘要研究第12-13页
    1.3 本论文研究内容及章节安排第13-15页
        1.3.1 本论文研究内容第13-14页
        1.3.2 本论文章节安排第14-15页
第2章 Web新闻自动摘要相关知识第15-22页
    2.1 自动摘要的分类与方法第15-16页
        2.1.1 自动摘要的分类第15-16页
        2.1.2 自动摘要的方法第16页
    2.2 Heritrix框架的组件结构第16-19页
    2.3 网页正文抽取方法第19-21页
    2.4 本章小结第21-22页
第3章 Web新闻自动摘要算法的研究第22-38页
    3.1 基于行块分布函数的网页正文抽取第22-24页
    3.2 TextRank算法第24页
    3.3 BM25算法第24-26页
    3.4 基于文本特征的摘要方法第26页
    3.5 一种新的融合BM25与文本特征的新闻摘要算法第26-37页
        3.5.1 问题的提出第26-27页
        3.5.2 算法思想第27页
        3.5.3 算法步骤及伪代码描述第27-32页
        3.5.4 关键问题的讨论与处理第32-33页
        3.5.5 算法性能分析第33-37页
    3.6 本章小结第37-38页
第4章 算法实验与结果分析第38-46页
    4.1 评价工具ROUGE介绍第38-40页
    4.2 Pos评分和TF评分的比例实验第40-42页
    4.3 不同算法的对比实验第42-45页
    4.4 实验结果分析第45页
    4.5 本章小结第45-46页
第5章 Web新闻自动摘要系统的设计与实现第46-61页
    5.1 系统功能第46-47页
    5.2 功能模块设计与实现第47-60页
        5.2.1 新闻网页采集第47-52页
        5.2.2 新闻网页正文抽取第52-55页
        5.2.3 文本的图模型表示第55-57页
        5.2.4 计算句子权重第57-58页
        5.2.5 提取摘要并显示第58-60页
    5.3 本章小结第60-61页
结论与展望第61-64页
    结论第61-62页
    进一步工作第62-64页
致谢第64-66页
参考文献第66-70页
攻读硕士学位期间发表的论文及科研成果第70页

论文共70页,点击 下载论文
上一篇:欺诈网页挖掘中特征优选及检测性能研究
下一篇:针对欺诈网页高度数据不平衡问题的分类检测方法研究