首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于网络文本的多词表达抽取方法研究

致谢第5-6页
摘要第6-7页
ABSTRACT第7-8页
1 引言第11-19页
    1.1 研究背景及意义第11-13页
        1.1.1 研究背景第11页
        1.1.2 研究意义第11-13页
    1.2 国内外研究现状第13-14页
    1.3 网络文本中多词表达抽取的特点和难点第14-17页
        1.3.1 多词表达的特点分析第15-16页
        1.3.2 多词表达抽取的难点第16-17页
    1.4 本文的组织结构第17-19页
2 相关理论与技术介绍第19-29页
    2.1 基于统计的序列标注方法第19-24页
        2.1.1 条件随机场模型第20-22页
        2.1.2 感知机算法模型第22-23页
        2.1.3 最大熵模型第23-24页
    2.2 多词表达抽取的相关技术第24-28页
        2.2.1 基于统计模型的方法第25-26页
        2.2.2 基于有监督学习的方法第26-27页
        2.2.3 基于语言学知识的方法第27-28页
    2.3 本章小结第28-29页
3 基于规则与统计相融合的多词表达抽取方法第29-43页
    3.1 基于规则与统计相融合的多词表达抽取框架第29-30页
    3.2 网络文本中多词表达构词模式第30页
    3.3 统计模型改进算法第30-33页
        3.3.1 互信息第31页
        3.3.2 C-value/NC-value算法第31-32页
        3.3.3 互信息融合NC值的改进算法第32-33页
    3.4 基于规则与统计相融合的多词表达抽取算法第33-34页
    3.5 基于左右词信息的停用词表建立第34-35页
    3.6 实验结果及分析第35-42页
        3.6.1 网络文本语料预处理第35-37页
        3.6.2 多词表达抽取实验结果评测标准第37-38页
        3.6.3 基于规则与统计相融合多词表达抽取的实验结果及分析第38-42页
    3.7 本章小结第42-43页
4 基于双层策略的多词表达抽取方法第43-60页
    4.1 基于双层策略的多词表达抽取框架第43-44页
    4.2 第一层次一多词表达候选识别第44-46页
        4.2.1 左右熵第45页
        4.2.2 增强互信息第45页
        4.2.3 基于左右熵联合增强互信息(LRE+EMI)改进算法第45-46页
    4.3 第二层次—多词表达候选过滤第46-52页
        4.3.1 支持向量机分类器简介第47-48页
        4.3.2 Word2vec词向量应用第48-50页
        4.3.3 基于上下文与词向量特征的多词表达候选过滤第50-52页
    4.4 实验结果及分析第52-57页
        4.4.1 第一层次实验结果分析第52-54页
        4.4.2 第二层次实验结果分析第54-57页
    4.5 多词表达抽取对分词结果的影响第57-58页
        4.5.1 分词实验结果评测标准第57页
        4.5.2 分词实验结果对比第57-58页
    4.6 本章小结第58-60页
5 总结与展望第60-61页
参考文献第61-64页
作者简历及攻读硕士学位期间取得的研究成果第64-66页
学位论文数据集第66页

论文共66页,点击 下载论文
上一篇:基于视觉的高压输电线路锈蚀检测
下一篇:基于跨模态分析的隐式网络水军检测研究