信息检索用汉语分词与未登录词识别技术研究
摘要 | 第1-9页 |
ABSTRACT | 第9-11页 |
第一章 绪论 | 第11-14页 |
·汉语分词在中文信息处理中的意义 | 第11-12页 |
·汉语分词的现实性与可能性 | 第12-13页 |
·论文的主要研究内容 | 第13-14页 |
第二章 相关技术研究 | 第14-24页 |
·汉语分词的标准与原则 | 第14-15页 |
·汉语分词的基本算法 | 第15-19页 |
·最长匹配法 | 第15-16页 |
·最少分词法 | 第16-17页 |
·基于统计语言模型的分词方法 | 第17页 |
·基于隐马尔科夫模型的分词方法 | 第17-18页 |
·汉语分词算法比较 | 第18-19页 |
·汉语分词系统介绍 | 第19页 |
·汉语分词的关键问题 | 第19-24页 |
·歧义切分问题 | 第19-21页 |
·未登录词识别问题 | 第21-24页 |
第三章 汉语自适应分词算法研究 | 第24-54页 |
·信息检索用汉语分词的特点 | 第24-26页 |
·汉语自适应分词算法提出 | 第26-31页 |
·算法术语描述 | 第26-27页 |
·算法原理概述 | 第27页 |
·算法原理细则 | 第27-29页 |
·歧义识别辅助未登录词识别 | 第29-31页 |
·汉语自适应逆向最长分词算法描述及实现 | 第31-34页 |
·汉语自适应分词算法中的未登录词识别技术研究 | 第34-43页 |
·未登录词识别的数量词识别规则 | 第34-36页 |
·未登录词识别的边界单字规则 | 第36页 |
·未登录词识别的虚字辅助规则 | 第36-38页 |
·未登录词识别中的单字非成词概率规则 | 第38-41页 |
·未登录词识别的记忆识别规则 | 第41-43页 |
·汉语自适应分词算法 | 第43-49页 |
·汉语自适应分词算法描述 | 第43-46页 |
·汉语自适应分词算法流程图描述 | 第46-47页 |
·算法中的未登录词识别模块流程图描述 | 第47-49页 |
·汉语自适应分词算法中的词表查询算法研究 | 第49-54页 |
·词表查询算法简介 | 第49-50页 |
·对传统词表查询算法的改进 | 第50-54页 |
第四章 汉语自适应分词系统 | 第54-72页 |
·汉语自适应分词系统的总体设计 | 第54-55页 |
·汉语自适应分词系统核心模块设计 | 第55-58页 |
·语句预处理模块 | 第55-56页 |
·未登录词识别模块 | 第56-57页 |
·歧义处理模块 | 第57-58页 |
·词表管理模块 | 第58页 |
·汉语自适应分词算法动态链接库的设计 | 第58-60页 |
·汉语自适应分词系统的词表建设 | 第60-61页 |
·汉语自适应分词系统的开发环境简介 | 第61页 |
·汉语自适应分词系统的实现 | 第61-66页 |
·汉语自适应分词系统的可扩展性与可移植性 | 第66-72页 |
·汉语自适应分词系统的可扩展性 | 第66-67页 |
·汉语自适应分词系统支持多种访问接口 | 第67-69页 |
·移植汉语自适应分词系统到Linux平台下 | 第69-72页 |
第五章 汉语自适应分词系统测评 | 第72-90页 |
·分词系统测评概述 | 第72-73页 |
·系统的效能测评 | 第73-82页 |
·系统的处理性能测评 | 第73-75页 |
·系统的CPU与RAM负荷测评 | 第75-77页 |
·系统的稳定性测评 | 第77-82页 |
·系统的分词准确率测评 | 第82-84页 |
·系统识别未登录词的性能测评 | 第84-90页 |
第六章 总结与展望 | 第90-93页 |
·所做的主要工作 | 第90-91页 |
·本文的创新之处 | 第91页 |
·存在的问题 | 第91-92页 |
·进一步的工作 | 第92-93页 |
参考文献 | 第93-98页 |
致谢 | 第98页 |