首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

统计与规则相结合的中文分词模型设计与实现

摘要第1-7页
Abstract第7-12页
第1章 绪论第12-16页
   ·课题研究背景及意义第12-13页
   ·国内外研究现状分析第13-14页
   ·论文主要内容与章节安排第14-16页
第2章 中文分词技术及相关统计模型理论基础第16-29页
   ·中文分词技术第16-18页
     ·基于字符串匹配的分词方法第16-17页
     ·基于理解的分词方法第17页
     ·基于统计的分词方法第17-18页
   ·中文分词两大难点第18-24页
     ·歧义识别第18-22页
     ·未登录词识别第22-24页
   ·统计模型理论基础第24-28页
     ·N-gram统计模型第24-25页
     ·基于统计的N-最短路径粗分模型第25-26页
     ·隐马尔可夫模型(HMM)第26-27页
     ·Viterbi算法第27-28页
   ·本章小结第28-29页
第3章 分词系统总体框架设计与实现第29-46页
   ·分词系统总体框架第29-30页
   ·词典结构第30-31页
   ·初切分模块的设计与实现第31-38页
     ·分词前预处理第31页
     ·原子切分第31-33页
     ·全切分第33-35页
     ·权值计算第35-37页
     ·基于统计的N-最短路径初切分第37-38页
   ·未登录词识别第38-42页
     ·时间词和数字词识别第38-39页
     ·基于角色的人名识别第39-42页
     ·基于角色的地名识别第42页
   ·基于类的隐马分词第42-44页
   ·基于ATN和基于类的隐马词性标注第44-45页
   ·本章小结第45-46页
第4章 基于统计的N-最短路径与ATN综合排歧第46-58页
   ·扩充转换网络理论基础第46-49页
     ·有限状态转换网络(FTN)第46-47页
     ·递归状态转换网络(RTN)第47页
     ·扩充状态转换网络(ATN)第47-49页
   ·扩充转换网络设计第49-55页
     ·名词短语(NP)网络文法设计第49-51页
     ·动宾短语(VP)网络文法设计第51页
     ·介词短语(PP)网络文法设计第51-52页
     ·简单句型(SS)网络文法设计第52-54页
     ·弧与寄存器第54-55页
   ·ATN算法描述第55-56页
   ·基于统计的N-最短路径与ATN综合排歧第56-57页
   ·本章小结第57-58页
第5章 实验及结果分析第58-68页
   ·实验评测指标第58页
   ·实验描述第58-59页
   ·实验过程第59-67页
     ·歧义切分实验第59-64页
     ·不同领域语料测试第64页
     ·对比实验第64-67页
   ·实验结果分析第67页
   ·本章小结第67-68页
结论与未来的工作第68-70页
致谢第70-71页
参考文献第71-75页
附录第75-83页
攻读硕士学位期间发表的论文第83页

论文共83页,点击 下载论文
上一篇:高校二级教学单位学生管理信息化建设研究与设计
下一篇:基于三维视景的列车行车模拟系统的设计与实现