首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于词典和概率统计的中文分词算法研究

摘要第1-6页
ABSTRACT第6-12页
第1章 绪 论第12-18页
   ·研究背景及意义第12-13页
     ·研究背景第12-13页
     ·研究意义第13页
   ·分词研究现状第13-16页
     ·ICTCLAS 汉语词法分析系统第14-15页
     ·基于字标注的分词系统.第15-16页
   ·问题提出第16页
   ·论文组织结构第16-18页
第2章 中文分词概述第18-29页
   ·中文分词中的基本问题第18-20页
     ·汉语分词规范第18-19页
     ·歧义切分问题第19页
     ·未登录词问题第19-20页
   ·基本分词方法第20-23页
     ·基于字符串匹配的分词方法第20-22页
     ·基于统计的分词方法第22-23页
     ·基于理解的分词方法第23页
   ·n 元语言模型第23-25页
   ·N-最短路径方法第25-27页
     ·基本思想第26页
     ·模型求解第26-27页
   ·中文分词研究的新思维第27-28页
 本章小结第28-29页
第3章 中文新词识别第29-38页
   ·新词识别简介第29-31页
     ·新词的定义第29-30页
     ·新词识别的研究现状第30-31页
   ·候选新词的提取第31-35页
     ·候选新词的分类第31-32页
     ·新词识别步骤第32-35页
   ·“重复串”新词判定策略第35-37页
 本章小结第37-38页
第4章 基于双向n 元模型含词位置信息的分词方法第38-48页
   ·双向n 元语言模型第38-42页
     ·逆向n 元语言模型第38-39页
     ·双向三元语言模型第39-42页
   ·词在句子中的位置信息第42-44页
   ·基于双向三元模型的中文分词第44-45页
   ·平滑处理第45-46页
 本章小结第46-48页
第5章 实验结果及分析第48-57页
   ·实验环境及测评指标第48-50页
     ·实验环境及资源第48-49页
     ·测评指标第49-50页
   ·新词识别实验数据及分析第50-52页
     ·实验结果第50-51页
     ·结果分析第51-52页
   ·中文分词实验第52-55页
     ·系统说明第52页
     ·系统演示第52-54页
     ·系统实验一第54-55页
     ·系统实验二第55页
   ·分词方法的比较第55-56页
 本章小结第56-57页
第6章 总结与展望第57-59页
   ·本文工作成果总结第57-58页
   ·工作中不足及展望第58-59页
致谢第59-60页
参考文献第60-63页
攻读学位期间发表的学术论文及参加科研情况第63-64页

论文共64页,点击 下载论文
上一篇:网络时代中国国家信息安全问题研究
下一篇:基于场景几何约束的摄像机标定方法研究