首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

针对特定领域的中文新词发现技术研究

摘要第1-5页
Abstract第5-9页
图表清单第9-10页
第一章 绪论第10-17页
   ·研究背景与意义第10-11页
   ·国内外研究概况第11-15页
     ·专业词汇抽取方法分类第11-13页
     ·关联规则挖掘及其应用研究第13页
     ·中文分词技术分类第13-14页
     ·N-Gram 方法研究第14-15页
   ·研究内容与文章框架第15-16页
   ·本文的研究重点和创新点第16-17页
第二章 相关理论和技术第17-34页
   ·中文分词技术的理论和方法第17-22页
     ·中文的特点第17-18页
     ·基于字符串匹配的分词方法第18-21页
     ·基于统计语言模型的分词算法第21-22页
   ·新词发现技术第22-25页
     ·基于规则的新词发现方法第23-25页
     ·基于统计的新词发现方法第25页
   ·N-Gram 模型介绍第25-30页
     ·N-gram 方法的思想第25-27页
     ·N-Gram 方法的过程第27-28页
     ·N-Gram 方法在分词中的应用第28-29页
     ·利用 N-Gram 方法进行分词的优缺点第29-30页
   ·关联规则挖掘第30-34页
     ·关联规则挖掘的思想第30-31页
     ·关联规则挖掘的 Apriori 算法第31-34页
第三章 中文分词方法的研究第34-43页
   ·分词前的准备工作第34-35页
     ·文档集处理第34-35页
     ·其它设置第35页
   ·利用改进的 N-Gram 方法进行分词第35-43页
     ·算法描述第35-40页
     ·算法应用第40-43页
第四章 专业词汇抽取方法研究第43-52页
   ·预处理过程第43-47页
     ·预设专业词典第43-44页
     ·预设噪声词词典第44页
     ·高频噪声词的处理第44-45页
     ·分词结果的分类和切割第45-47页
   ·利用 Apriori 算法进行专业词汇挖掘第47-50页
     ·最小支持度和最小置信度的设定第47页
     ·挖掘算法及过程第47-50页
   ·总结第50-52页
第五章 新词发现原型系统的设计第52-64页
   ·系统功能分析第52-54页
     ·系统总体功能的描述第52-53页
     ·预处理模块及其功能第53页
     ·分词模块及其功能第53页
     ·专业词汇提取模块及其功能第53-54页
   ·系统实现第54-57页
     ·预处理模块的实现第54-55页
     ·分词模块的实现第55-56页
     ·专业词汇提取模块的实现第56-57页
   ·系统运行第57-63页
     ·预处理模块的运行效果第57-58页
     ·分词模块的运行效果第58-62页
     ·专业词汇提取模块的运行效果第62-63页
   ·总结第63-64页
第六章 总结与展望第64-66页
   ·论文总结第64页
   ·研究展望第64-66页
参考文献第66-69页
致谢第69-70页
在学期间的研究成果及发表的学术论文第70-71页
附录第71-80页

论文共80页,点击 下载论文
上一篇:基于动态领域知识体系的信息采集方法及实现
下一篇:数字美术图形元素布局与图像构成分析研究