首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于互联网海量语料的新词发现研究及中文分词系统改进

摘要第1-4页
Abstract第4-8页
第1章 绪论第8-22页
   ·研究背景及意义第8-9页
   ·新词发现相关研究综述第9-12页
     ·新词定义及其识别难点第9-10页
     ·新词的研究领域第10页
     ·新词识别的研究现状第10-12页
     ·本文解决的新词识别问题第12页
   ·新词词性推测相关研究综述第12-14页
     ·新词词性推测的研究意义和目的第12-13页
     ·新词词性推测的研究现状第13-14页
     ·新词词性推测的技术难点分析第14页
   ·分词系统相关研究综述第14-19页
     ·中文分词的背景第14-15页
     ·中文分词算法第15-17页
     ·中文分词难点第17-19页
     ·中文分词的应用第19页
   ·本文的主要工作内容第19-20页
   ·本文结构第20-22页
第2章 PMI方法和PMI改进方法第22-28页
   ·PMI方法定义及其定理第22-23页
   ·PMI改进方法定义及其定理第23-26页
   ·本章小结第26-28页
第3章 新词发现第28-44页
   ·语料库预处理阶段第28-30页
   ·统计1-n元字串串频第30-31页
   ·新词抽取第31-36页
     ·确定2元待扩展种子第31-32页
     ·将2元待扩展种子扩展至2-n元候选新词第32-34页
     ·规则过滤第34-36页
   ·新词判定第36页
   ·实验结果与分析第36-42页
     ·实验数据第36页
     ·实验结果第36-40页
     ·结果分析第40-42页
   ·本章小结第42-44页
第4章 新词词性推测第44-50页
   ·语料库预处理阶段第44-45页
   ·解析XML文件及统计句频第45-46页
   ·抽取模板第46-47页
   ·抽取新词词性第47-48页
   ·词性抽取实验第48-49页
     ·实验数据第48页
     ·实验结果第48页
     ·结果分析第48-49页
   ·本章小结第49-50页
第5章 分词系统的改进第50-56页
   ·改进分词系统的方法第50页
   ·基于ICTCLAS系统测试第50-54页
     ·测试数据第51页
     ·测试方法第51页
     ·测试结果第51-53页
     ·测试结果分析第53-54页
   ·本章小结第54-56页
第6章 结论与展望第56-58页
   ·本文总结第56-57页
   ·展望第57-58页
参考文献第58-62页
攻读学位期间取得的研究成果第62-64页
致谢第64-66页

论文共66页,点击 下载论文
上一篇:高校思想政治教育工作和谐性研究
下一篇:基于移动增强现实的数字博物馆应用研究