首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于大规模语料的中文新词抽取算法的设计与实现

摘要第1-4页
Abstract第4-7页
1 绪论第7-13页
   ·课题背景第7页
   ·何谓新词第7-9页
   ·研究意义第9-10页
   ·新词抽取的难点第10-11页
   ·本文研究内容第11页
   ·论文的组织结构第11-13页
2 新词抽取研究第13-19页
   ·候选新词集合构造第13-15页
     ·基于分词的方法第13-14页
     ·基于启发式规则的方法第14页
     ·基于重复串的方法第14-15页
   ·新词检测技术第15-17页
     ·基于统计学习的方法第15-16页
     ·基于语言规则的方法第16-17页
   ·评测标准第17页
   ·本文新词抽取思路第17-18页
   ·本章小结第18-19页
3 基于大规模语料的重复串抽取第19-32页
   ·相关工作第19-20页
   ·基于语料划分的重复串抽取算法第20-23页
     ·语料划分策略第20-21页
     ·算法实现第21-23页
   ·子串归并第23-25页
   ·字符串排序算法改进第25-27页
   ·实验及数据分析第27-31页
     ·实验环境第27页
     ·实验数据分析第27-30页
     ·相关研究比较第30-31页
   ·本章小结第31-32页
4 新词自动检测第32-47页
   ·最大熵模型概述第32-37页
     ·思想简介第32-33页
     ·相关基础概念第33-34页
     ·模型的构造第34-36页
     ·模型的解码第36-37页
     ·最大熵模型的特点第37页
   ·新词特征分析第37-42页
     ·语言知识特征第37-38页
     ·统计特征第38-40页
     ·左右熵特征抽取算法的改进第40-42页
   ·实验与分析第42-45页
   ·相关研究比较第45-46页
   ·本章小结第46-47页
5 新词抽取系统第47-54页
   ·新词抽取算法第47-48页
   ·新词抽取系统第48-53页
     ·系统简介第48-49页
     ·预处理模块第49-50页
     ·重复串抽取模块第50-51页
     ·新词检测模块第51页
     ·处理结果展示第51-53页
   ·本章小结第53-54页
6 结束语第54-56页
   ·总结第54页
   ·展望第54-56页
致谢第56-58页
参考文献第58-61页
附录第61页

论文共61页,点击 下载论文
上一篇:基于规则引擎的信息分类处理技术研究
下一篇:数据库效率比较研究及其在居民健康档案管理中的应用