首页--文化、科学、教育、体育论文--科学、科学研究论文--情报学、情报工作论文--情报检索论文

信息检索用汉语分词与未登录词识别技术研究

摘要第1-9页
ABSTRACT第9-11页
第一章 绪论第11-14页
   ·汉语分词在中文信息处理中的意义第11-12页
   ·汉语分词的现实性与可能性第12-13页
   ·论文的主要研究内容第13-14页
第二章 相关技术研究第14-24页
   ·汉语分词的标准与原则第14-15页
   ·汉语分词的基本算法第15-19页
     ·最长匹配法第15-16页
     ·最少分词法第16-17页
     ·基于统计语言模型的分词方法第17页
     ·基于隐马尔科夫模型的分词方法第17-18页
     ·汉语分词算法比较第18-19页
   ·汉语分词系统介绍第19页
   ·汉语分词的关键问题第19-24页
     ·歧义切分问题第19-21页
     ·未登录词识别问题第21-24页
第三章 汉语自适应分词算法研究第24-54页
   ·信息检索用汉语分词的特点第24-26页
   ·汉语自适应分词算法提出第26-31页
     ·算法术语描述第26-27页
     ·算法原理概述第27页
     ·算法原理细则第27-29页
     ·歧义识别辅助未登录词识别第29-31页
   ·汉语自适应逆向最长分词算法描述及实现第31-34页
   ·汉语自适应分词算法中的未登录词识别技术研究第34-43页
     ·未登录词识别的数量词识别规则第34-36页
     ·未登录词识别的边界单字规则第36页
     ·未登录词识别的虚字辅助规则第36-38页
     ·未登录词识别中的单字非成词概率规则第38-41页
     ·未登录词识别的记忆识别规则第41-43页
   ·汉语自适应分词算法第43-49页
     ·汉语自适应分词算法描述第43-46页
     ·汉语自适应分词算法流程图描述第46-47页
     ·算法中的未登录词识别模块流程图描述第47-49页
   ·汉语自适应分词算法中的词表查询算法研究第49-54页
     ·词表查询算法简介第49-50页
     ·对传统词表查询算法的改进第50-54页
第四章 汉语自适应分词系统第54-72页
   ·汉语自适应分词系统的总体设计第54-55页
   ·汉语自适应分词系统核心模块设计第55-58页
     ·语句预处理模块第55-56页
     ·未登录词识别模块第56-57页
     ·歧义处理模块第57-58页
     ·词表管理模块第58页
   ·汉语自适应分词算法动态链接库的设计第58-60页
   ·汉语自适应分词系统的词表建设第60-61页
   ·汉语自适应分词系统的开发环境简介第61页
   ·汉语自适应分词系统的实现第61-66页
   ·汉语自适应分词系统的可扩展性与可移植性第66-72页
     ·汉语自适应分词系统的可扩展性第66-67页
     ·汉语自适应分词系统支持多种访问接口第67-69页
     ·移植汉语自适应分词系统到Linux平台下第69-72页
第五章 汉语自适应分词系统测评第72-90页
   ·分词系统测评概述第72-73页
   ·系统的效能测评第73-82页
     ·系统的处理性能测评第73-75页
     ·系统的CPU与RAM负荷测评第75-77页
     ·系统的稳定性测评第77-82页
   ·系统的分词准确率测评第82-84页
   ·系统识别未登录词的性能测评第84-90页
第六章 总结与展望第90-93页
   ·所做的主要工作第90-91页
   ·本文的创新之处第91页
   ·存在的问题第91-92页
   ·进一步的工作第92-93页
参考文献第93-98页
致谢第98页

论文共98页,点击 下载论文
上一篇:翻译的不确定性与翻译标准的研究
下一篇:整装式液体发射药燃烧推进实验及数值计算