首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于主特征空间相似度计算的新词挖掘研究

中文摘要第1-6页
ABSTRACT第6-9页
1. 绪论第9-15页
   ·新词的定义与分类第9页
   ·课题背景第9-10页
   ·本课题研究的意义第10-11页
   ·国内外相关技术发展现状第11-13页
     ·基于规则的新词挖掘方法第11-12页
     ·基于统计的新词挖掘方法第12-13页
     ·基于规则和统计相结合的新词挖掘方法第13页
   ·本文主要研究内容第13-15页
2. 基于主特征空间相似度计算新词候选挖掘研究第15-25页
   ·引言第15页
   ·主成分分析的基本原理第15-19页
     ·主成分分析的思想第15-16页
     ·主成分分析的数学模型第16-17页
     ·主成分分析的几何解释第17-19页
   ·基于主特征空间相似度计算的候选新词挖掘算法第19-25页
     ·设计思想第19-20页
     ·算法流程第20-23页
     ·程序流程第23页
     ·参数设置第23-25页
3. 基于新词特性的候选新词过滤方案研究第25-32页
   ·引言第25-26页
   ·热度和突发度过滤策略第26-28页
   ·接受度过滤策略第28-32页
     ·信息熵第28-29页
     ·接受度在新词过滤上的应用第29-32页
4. 新词挖掘模块在输入法中的应用第32-44页
   ·引言第32页
   ·Hadoop 平台第32-35页
     ·平台简介第32-33页
     ·Hadoop Streaming 简介第33-34页
     ·Hadoop Streaming 简单使用第34-35页
   ·候选词抽取模块第35-37页
     ·输入语料第35-36页
     ·处理过程第36-37页
     ·输出结果第37页
   ·候选词过滤模块第37-44页
     ·热度突发度过滤方案第38-39页
     ·接受度过滤方案第39-42页
     ·其它过滤方案第42页
     ·过滤模块设计第42-44页
5. 实验结果和性能分析第44-46页
   ·实验评估指标第44页
   ·结果分析第44-45页
   ·性能分析第45-46页
6. 总结及展望第46-48页
参考文献第48-51页
攻读硕士学位期间发表学术论文情况第51-52页
致谢第52-53页
作者简介第53-55页

论文共55页,点击 下载论文
上一篇:基于构件的ERP系统设计方法研究
下一篇:基于先验形状信息的水平集分割方法研究