首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

中文新闻事件抽取方法研究

摘要第5-6页
Abstract第6-8页
第一章 绪论第11-17页
    1.1 背景与意义第11-12页
    1.2 国内外研究现状以及存在的问题第12-15页
    1.3 研究内容第15-16页
    1.4 论文的组织第16-17页
第二章 间新闻数据采集第17-25页
    2.1 引言第17页
    2.2 相关概念第17-18页
        2.2.1 文档对象模型DOM第17-18页
        2.2.2 XPath和RegExp第18页
    2.3 页面分析第18-20页
        2.3.1 主流的新闻页面分析工具第19页
        2.3.2 HtmlUnit页面分析技术第19-20页
    2.4 定制采集模板第20-22页
    2.5 采集系统总体设计与实现第22-24页
    2.6 本章小结第24-25页
第三章 新闻子事件元素抽取第25-41页
    3.1 新闻子事件描述及相关定义第25-26页
    3.2 新闻子事件分析第26-27页
    3.3 新闻子事件类别识别第27-32页
        3.3.1 构建触发词表第28页
        3.3.2 获取候选子事件与子事件类别第28-30页
        3.3.3 基于支持向量机模型的事件类别识别第30-32页
    3.4 新闻子事件元素抽取第32-36页
        3.4.1 构建子事件模板第32-33页
        3.4.2 获取候选子事件元素第33页
        3.4.3 基于最大熵模型的子事件元素获取第33-36页
    3.5 实验结果与分析第36-39页
        3.5.1 实验数据第36-37页
        3.5.2 事件类别识别实验结果与分析第37-38页
        3.5.3 事件元素识别实验结果与分析第38-39页
    3.6 本章小结第39-41页
第四章 新闻事件要素抽取无向图模型第41-51页
    4.1 问题描述第41-42页
    4.2 基于新闻子事件元素的无向图构建第42-46页
        4.2.1 无向图节点和边的生成第42-43页
        4.2.2 基于相似度的无向图边权重计算第43-46页
    4.3 无向图节点权重计算第46-48页
        4.3.1 新闻子事件元素权重计算方法第46-48页
        4.3.2 基于节点权重的事件要素抽取第48页
    4.4 实验结果与分析第48-49页
        4.4.1 实验方案第48页
        4.4.2 实验评价指标第48-49页
        4.4.3 实验结果与分析第49页
    4.5 本章小结第49-51页
第五章 中文新闻事件抽取原型系统第51-57页
    5.1 引言第51页
    5.2 系统架构第51-53页
    5.3 功能展示第53-55页
    5.4 本章小结第55-57页
第六章 总结与展望第57-59页
    6.1 论文总结第57页
    6.2 下一步工作第57-59页
致谢第59-61页
参考文献第61-67页
附录A 攻读硕士期间发表的论文第67-68页
附录B 攻读硕士期间参与项目第68-69页
附录C 攻读硕士期间申请软件著作权第69页

论文共69页,点击 下载论文
上一篇:基于HTML 5的跨平台移动家教信息服务系统的设计与实现
下一篇:基于图像分块稀疏表示的人脸识别算法研究