首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

非结构化文本中领域术语获取方法的研究

摘要第1-5页
ABSTRACT第5-7页
目录第7-9页
1 绪论第9-13页
   ·研究背景与意义第9-10页
   ·国内外研究现状综述第10-12页
     ·领域术语自动获取的研究进展第10-11页
     ·领域术语自动获取研究存在的主要问题第11-12页
   ·论文的主要工作第12页
   ·论文内容的组织第12-13页
2 领域术语自动获取的原理第13-22页
   ·领域术语自动获取的理论背景第13-15页
     ·领域术语定义和标注规范第13-14页
     ·信息抽取概述第14-15页
     ·领域术语获取问题的转化第15页
   ·任务描述第15-16页
   ·领域术语自动获取的框架结构和工作机理第16-19页
   ·特征表示第19-20页
     ·领域术语获取中的特征表示第19页
     ·特征选择第19-20页
   ·领域术语获取的性能评价第20-21页
   ·本章小结第21-22页
3 基于分类的领域术语获取方法第22-29页
   ·基于分类模型的领域术语获取方法及形式化第22-24页
   ·领域术语获取中分类模型的基本原理第24-26页
     ·支持向量机第24-25页
     ·朴素贝叶斯第25-26页
   ·分类模型在领域术语获取任务中的问题分析第26-27页
     ·Na(?)ve Bayes和 SVM 的特点比较第26页
     ·分类模型在领域术语获取中的问题分析第26-27页
   ·分类方法的领域术语特征表示策略第27-28页
   ·本章小结第28-29页
4 基于序列数据标注的领域术语获取方法第29-40页
   ·基于序列数据标注模型的领域术语获取方法及形式化第29-31页
     ·问题转化第29-30页
     ·形式化表示和序列数据标注模型的框架第30-31页
   ·序列数据标注模型的基本原理第31-35页
     ·最大熵马尔可夫模型(MEMM)第32-33页
     ·条件随机场模型(CRF)第33-35页
   ·序列数据标注模型在领域术语获取任务中的问题分析第35-36页
     ·MEMM 和 CRF 的特点比较第35-36页
     ·序列数据标注模型在领域术语自动抽取中的问题分析第36页
   ·序列数据标注方法的领域术语特征表示策略第36-39页
   ·本章小结第39-40页
5 基于 Reranking 的领域术语获取方法第40-47页
   ·Reranking 方法介绍第40-43页
     ·Reranking 定义和形式化表示第40-41页
     ·Reranking 任务中的算法第41-43页
   ·Ranking SVM第43-44页
   ·Reranking 方法在领域术语获取任务中的问题分析第44-45页
   ·Reraning 方法的领域术语特征表示策略第45-46页
   ·本章小结第46-47页
6 领域术语获取方法的实验及验证第47-53页
   ·数据集准备及所需的工具第47-50页
     ·实验数据集准备第47-48页
     ·实验所需工具第48-50页
   ·基于分类的领域术语获取实验第50-51页
   ·基于序列数据标注的领域术语获取实验第51-52页
   ·基于 Reranking 的领域术语获取实验第52页
   ·实验结论第52页
   ·本章小结第52-53页
7 结论与展望第53-55页
   ·工作总结第53-54页
   ·展望第54-55页
致谢第55-57页
参考文献第57-59页
研究生期间所作工作第59页

论文共59页,点击 下载论文
上一篇:好人的罪恶感:《伙计》的心理阐释
下一篇:艾丽丝·沃克的《梅里迪安》的妇女主义解读