首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

面向专利文献的中文分词技术的研究

摘要第1-7页
Abstract第7-11页
第1章 绪论第11-15页
   ·课题的提出第11-12页
   ·本文的研究意义第12-13页
   ·本文的主要工作第13-14页
   ·本文的结构安排第14-15页
第2章 相关研究方法概述第15-25页
   ·汉语自动分词的难点第15-18页
     ·分词规范问题第15-17页
     ·歧义切分问题第17页
     ·未登录词识别问题第17-18页
   ·现有研究方法第18-21页
     ·基于词典的方法第18-19页
     ·基于统计的方法第19-20页
     ·基于字标注的方法第20-21页
   ·统计语言模型的理论介绍第21-24页
     ·N 元文法统计模型第22-23页
     ·条件随机场模型第23-24页
   ·本章小结第24-25页
第3章 统计和规则相结合的分词技术研究第25-34页
   ·专利文献分析第25-28页
     ·面向专利文献分词的标准第25-26页
     ·专利文献的特点和自动切分的难点分析第26-27页
     ·专利术语多层次切分第27-28页
   ·基于统计和规则相结合的分词技术第28-33页
     ·基于规则的预处理模型第29-30页
     ·统计上下文信息模型第30-31页
     ·统计语言模型第31-32页
     ·后处理第32-33页
   ·本章小结第33-34页
第4章 基于条件随机场的分词方法研究第34-39页
   ·基于字的条件随机场模型的分词研究第34-37页
     ·标注集第35页
     ·特征模板第35-36页
     ·特征的选择第36-37页
   ·基于字词混合的条件随机场模型的分词研究第37-38页
     ·基于字的模型中存在的问题第37页
     ·融入无监督分词信息第37-38页
     ·基于字和词的标注框架第38页
   ·本章小结第38-39页
第5章 系统设计及实现第39-49页
   ·系统设计及实现第39-44页
     ·专利分词系统的设计第39-40页
     ·基于统计和规则相结合分词模块第40-41页
     ·基于条件随机场的分词模块第41-44页
   ·实验结果分析第44-48页
     ·评测方法第44页
     ·实验语料第44页
     ·结果及分析第44-48页
   ·本章小结第48-49页
结论第49-51页
附录I 专利文献的切分规范第51-53页
参考文献第53-56页
致谢第56-58页
攻读硕士期间发表(含录用)的学术论文及科研成果第58页

论文共58页,点击 下载论文
上一篇:基于二维S变换的医学影像纹理特征分析技术的研究与实现
下一篇:基于数据库的加工工艺知识库关键技术的研究