首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

多项文本挖掘关键技术的研究和实现

摘要第4-6页
Abstract第6-7页
第1章 绪论第11-22页
    1.1 课题来源及研究的目的和意义第11-13页
        1.1.1 课题背景第11-13页
        1.1.2 课题研究内容第13页
    1.2 国内外研究现状分析第13-20页
        1.2.1 新词发现第13-15页
        1.2.2 事件识别第15-17页
        1.2.3 文档自动摘要第17-20页
    1.3 本文研究的主要内容第20-21页
    1.4 本文的结构安排第21-22页
第2章 基于bootstrapping的新词发现方法第22-37页
    2.1 新词发现任务概述第22页
    2.2 词向量和bootstrapping介绍第22-25页
        2.2.1 统计语言模型和词向量第22-24页
        2.2.2 Bootstrapping方法第24-25页
    2.3 基于Bootstrapping方法的新词发现第25-31页
        2.3.1 症状新词及其挖掘的基本流程第26-27页
        2.3.2 候选新词集及其初始化第27-28页
        2.3.3 候选新词的置信度评分第28-30页
        2.3.4 软模式更新和bootstrapping迭代第30-31页
    2.4 新词发现方法的评价第31-35页
        2.4.1 电子病历语料第31-32页
        2.4.2 三类新词的挖掘实验第32-34页
        2.4.3 词向量+词频向量和只使用词频向量的对比实验第34-35页
        2.4.4 和其他工作者的对比实验第35页
    2.5 本章小结第35-37页
第3章 基于SVM特征提取的事件识别第37-53页
    3.1 事件识别概述第37页
    3.2 支持向量机及其特征选择简介第37-40页
        3.2.1 支持向量机模型第37-39页
        3.2.2 序列最优化SMO算法第39-40页
    3.3 基于SVM的事件类别识别第40-45页
        3.3.1 事件触发词和触发词的扩展第40-43页
        3.3.2 特征选择第43-45页
    3.4 基于SVM的事件元素识别第45-47页
        3.4.1 事件元素识别任务简介第45页
        3.4.2 特征选择第45-47页
    3.5 实验结果与分析第47-51页
        3.5.1 实验数据简介第47-49页
        3.5.2 事件类别识别实验结果第49-50页
        3.5.3 事件元素识别实验结果第50-51页
    3.6 本章小结第51-53页
第4章 基于Text Rank和聚类的文档自动摘要第53-66页
    4.1 自动摘要概述第53-54页
    4.2 TextRank算法及其改进方法第54-57页
        4.2.1 Page Rank算法简介第54-56页
        4.2.2 Text Rank算法简介第56-57页
    4.3 基于聚类和TextRank的文档自动摘要方法第57-61页
        4.3.1 Text Rank无向图的生成第58-59页
        4.3.2 无向图聚类第59-60页
        4.3.3 自动摘要的生成第60-61页
    4.4 实验结果与分析第61-64页
        4.4.1 DUC2001上的实验结果第62-63页
        4.4.2 DUC2001上的实验结果第63-64页
    4.5 本章小结第64-66页
结论第66-68页
参考文献第68-75页
攻读学位期间发表的学术论文第75-76页
致谢第76-77页
个人简历第77-78页

论文共78页,点击 下载论文
上一篇:基于税收风险管理模式的纳税评估优化研究--以W市地方税务局为例
下一篇:浙江基层政府网络舆论引导机制研究--以永嘉县鹤盛镇为例