首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于大规模语料的中文新词识别技术研究

摘要第1-6页
Abstract第6-12页
图目录第12-13页
表目录第13-14页
第1章 绪论第14-19页
   ·课题背景第14-15页
   ·研究意义第15-16页
   ·中文新词识别研究现状第16-17页
   ·研究目标和研究内容第17-18页
   ·论文组织安排第18-19页
第2章 新词识别技术第19-30页
   ·引言第19页
   ·候选新词的提取和过滤第19-24页
   ·新词的词性猜测第24-26页
   ·新词识别技术研究状态第26-27页
   ·本文设计思想第27-28页
   ·论文总体设计第28-29页
   ·本章小结第29-30页
第3章 基于大规模语料的新词识别框架FNWI第30-39页
   ·引言第30页
   ·FNWI 的设计目标第30-32页
   ·新词识别框架的具体描述第32-37页
     ·统一建模语言UML第32-33页
     ·领域无关的新词识别框架结构第33-36页
     ·FNWI 框架中组件的重用第36-37页
     ·FNWI 框架的扩展第37页
   ·相关研究比较第37-38页
   ·本章小结第38-39页
第4章 基于逐层剪枝的重复模式快速提取方法第39-62页
   ·引言第39-40页
   ·常用重复模式提取算法第40-44页
     ·重复模式提取的形式化描述第40页
     ·基于递增N-gram 模型的重复模式提取算法第40-41页
     ·基于Sequitur 算法的重复模式提取方法第41-42页
     ·基于后缀索引的重复模式提取算法第42-44页
   ·大规模语料分割算法第44-45页
   ·一种基于逐层剪枝的重复模式提取方法第45-51页
     ·基于低频剪枝字符的低频模式过滤算法第46页
     ·基于级联剪枝的低频模式过滤算法第46-47页
     ·语料划分和重复模式归并第47-48页
     ·算法描述第48-50页
     ·复杂度分析第50-51页
   ·一种改进的字符串快速排序算法第51-55页
     ·基数排序算法描述第51-52页
     ·改进的中文字符串排序算法第52-53页
     ·改进排序算法性能评价第53-55页
   ·实验及分析第55-60页
   ·相关研究比较第60-61页
   ·本章小结第61-62页
第5章 基于条件随机域的新词检测方法第62-86页
   ·引言第62页
   ·常用新词检测方法第62-66页
     ·基于规则方法第63-64页
     ·基于统计学习方法第64-66页
     ·小结第66页
   ·基于统计学习模型的新词检测框架第66-68页
     ·条件随机域模型第66-67页
     ·条件随机域模型的训练和解码第67页
     ·条件随机域模型特点第67-68页
   ·新词检测特征选取第68-74页
     ·新词的语言知识特征第68-69页
     ·新词的统计特征第69-70页
     ·一种高效的外部统计特征计算方法第70-74页
   ·重复模式提取策略第74-80页
     ·对比实验数据第75-77页
     ·一种实用的候选新词遗漏量化模型第77-80页
     ·策略使用原则第80页
   ·实验和分析第80-84页
     ·实验条件第80-82页
     ·实验数据分析第82-84页
   ·相关研究比较第84-85页
   ·本章小结第85-86页
第6章 基于组合特征的新词分类方法第86-105页
   ·引言第86-87页
   ·新词词性分类技术第87-92页
     ·词语词性标注方法第87-91页
     ·新词词性猜测的困难和当前研究的不足第91-92页
   ·新词词性猜测的形式化模型第92-94页
     ·新词词性猜测的形式化描述第92页
     ·词性猜测问题统计模型的选择第92-93页
     ·新词词性猜测的特征选取第93-94页
   ·汉字偏旁作为词性猜测内部特征第94-97页
     ·汉字及其偏旁的表意功能第95页
     ·偏旁作为词性猜测内部特征第95-97页
   ·实验和分析第97-102页
     ·实验条件第97-98页
     ·实验数据分析第98-102页
     ·分析结论第102页
   ·相关研究比较第102-103页
   ·本章小结第103-105页
第7章 结论第105-108页
   ·全文总结第105-106页
   ·后续研究工作第106-108页
参考文献第108-113页
致谢第113-115页
攻读学位期间发表的学术论文与取得的其他研究成果第115-116页

论文共116页,点击 下载论文
上一篇:基于力学量信息获取系统的人体摔倒过程识别方法研究
下一篇:自旋目标运动成像与静止目标凝视成像方法及关键技术研究