首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于CRF的中文微博交通信息事件抽取

摘要第3-4页
ABSTRACT第4-5页
图录第8-9页
表录第9-10页
第一章 绪论第10-18页
    1.1 研究背景及意义第10-11页
    1.2 国内外研究现状第11-14页
        1.2.1 自然语言处理第12-13页
        1.2.2 信息抽取第13页
        1.2.3 基于微博的事件抽取第13-14页
    1.3 主要研究内容第14-16页
    1.4 章节安排与论文的主要内容第16-18页
第二章 微博预处理模块第18-33页
    2.1 系统结构概述第18-19页
    2.2 预处理所需技术分析第19-23页
        2.2.1 微博抓取第19-20页
        2.2.2 微博文本特点第20-21页
        2.2.3 微博话题限定第21-22页
        2.2.4 中文分词处理第22-23页
    2.3 预处理解决方案第23-32页
        2.3.1 微博的抓取第23-27页
        2.3.2 微博的标准化第27-28页
        2.3.3 微博话题筛选第28-29页
        2.3.4 微博文本分词处理第29-32页
    2.4 本章小结第32-33页
第三章 微博事件挖掘模块第33-52页
    3.1 系统结构概述第33-34页
    3.2 难点分析与方案选择第34-36页
    3.3 条件随机场第36-38页
        3.3.1 条件随机场的由来第36-37页
        3.3.2 条件随机场定义第37页
        3.3.3 CRF 处理工具第37-38页
    3.4 NER 与 EE 的 CRF 训练第38-47页
        3.4.1 语料库选择第38页
        3.4.2 手动标注与标注集第38-40页
        3.4.3 特征模板的确立第40-47页
        3.4.4 训练结果第47页
    3.5 NER 与 EE 的 CRF 测试第47-49页
        3.5.1 运行测试第48页
        3.5.2 评测体系第48页
        3.5.3 交叉验证第48页
        3.5.4 测试结果第48-49页
    3.6 实验结果分析第49-51页
        3.6.1 命名实体识别模块结果分析第49-50页
        3.6.2 事件要素抽取模块结果分析第50页
        3.6.3 微博标准化模块结果分析第50-51页
    3.7 本章小结第51-52页
第四章 事件展示模块第52-58页
    4.1 系统构架第52-53页
    4.2 系统运行第53页
    4.3 结果展示第53-56页
        4.3.1 正确的抽取结果第53-54页
        4.3.2 错误的抽取结果第54-56页
    4.4 错误分析第56-57页
    4.5 本章小结第57-58页
第五章 总结与展望第58-60页
    5.1 工作与总结第58-59页
    5.2 研究展望第59-60页
参考文献第60-64页
致谢第64-65页
攻读硕士学位期间已发表或录用的论文第65-67页

论文共67页,点击 下载论文
上一篇:基于虚拟化的云游戏GPU资源自适应调度策略
下一篇:基于双目立体视觉的距离测算及应用