首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于字符串匹配的中英文混合分词技术研究

摘要第1-4页
ABSTRACT第4-8页
1 引言第8-12页
   ·分词简介第8-9页
   ·中英文混合分词第9页
   ·分词的研究现状第9-11页
   ·本文主要的工作及安排第11-12页
2 分词相关理论和技术第12-25页
   ·分词的基本流程第12页
   ·分词的算法第12-15页
     ·基于字符串匹配的分词算法第12-13页
     ·基于统计的分词算法第13-14页
     ·基于规则的分词算法第14-15页
     ·基于理解的分词算法第15页
   ·分词的关键问题及解决方法第15-22页
     ·歧义处理第15-19页
     ·未登录词识别第19-21页
     ·分词词典第21-22页
   ·分词系统的评价第22-24页
     ·中文分词系统的评价指标第22-23页
     ·中英文混合分词系统的评价指标第23-24页
   ·本章小结第24-25页
3 词典机制及分词算法的实现及选择第25-48页
   ·词典机制的实现及选择第25-36页
     ·基于整词二分的词典机制第26-28页
     ·基于TRIE 索引树的词典机制第28-30页
     ·基于逐字二分的词典机制第30-31页
     ·双字哈希索引词典机制第31-34页
     ·词典机制的实验与分析第34-36页
     ·词典机制的选择第36页
   ·分词算法的实现第36-39页
     ·单字切分算法第36-37页
     ·双字切分算法第37-38页
     ·正向最大匹配算法第38-39页
     ·逆向最大匹配算法第39页
   ·算法测试、评价及分析第39-47页
     ·测试样例1第39-43页
     ·测试样例2第43-45页
     ·测试样例3第45-47页
   ·中英文混合分词模型设计方案的选择第47页
   ·本章小结第47-48页
4 基于字符串匹配的中英文混合分词模型CE_MixSeg第48-80页
   ·模型基本结构第48-49页
   ·文件处理模块第49-51页
   ·词典模块第51-55页
   ·索引数据库模块第55-56页
   ·分词模块第56-78页
     ·中英文混合分词策略第57-58页
     ·改进的逆向最大匹配算法第58-61页
     ·歧义处理及实验第61-68页
     ·中文姓名的识别及实验第68-78页
   ·综合实验及模型评价第78-79页
   ·本章小结第79-80页
5 总结第80-82页
   ·全文总结第80页
   ·后续研究工作第80-82页
致谢第82-83页
参考文献第83-85页

论文共85页,点击 下载论文
上一篇:小学几何教育软件的研究与开发
下一篇:基于静态图像轮廓的水墨画风格绘制技术研究