面向学科的新词汇抽取方法及应用研究

摘要	第5-6页
Abstract	第6页
1 绪论	第10-15页
1.1 研究背景及意义	第10-11页
1.2 研究现状及存在问题	第11-12页
1.3 研究内容	第12-13页
1.4 论文的组织结构	第13-15页
2 新词发现基础	第15-22页
2.1 新词发现的理论基础	第15-17页
2.1.1 新词的定义	第15-16页
2.1.2 新词的来源	第16页
2.1.3 对新词进行评价的方法	第16页
2.1.4 新词发现研究的困难	第16-17页
2.2 新词发现的技术基础	第17-21页
2.2.1 基于统计的方法	第17-19页
2.2.2 基于规则的方法	第19-20页
2.2.3 统计和规则相结合的方法	第20-21页
2.3 小结	第21-22页
3 贪婪的原子词汇构词法研究	第22-32页
3.1 关于构词法的相关研究	第22页
3.2 贪婪的原子词汇构词法	第22-26页
3.2.1 算法思想	第22-23页
3.2.2 算法原理分析	第23页
3.2.3 算法流程图	第23-26页
3.3 垃圾词串过滤	第26-29页
3.3.1 垃圾词串过滤的必要性	第26页
3.3.2 词串过滤的方法	第26-27页
3.3.3 过滤规则库的制定	第27-29页
3.4 算法性能分析	第29-31页
3.4.1 实验数据来源	第29页
3.4.2 实验结果分析	第29-31页
3.5 小结	第31-32页
4 面向学科的新词发现系统的分析与设计	第32-38页
4.1 系统体系结构设计	第32-33页
4.1.1 研究方案介绍	第32-33页
4.1.2 方案实施流程	第33页
4.2 系统功能模块设计	第33-37页
4.2.1 文本预处理	第33-34页
4.2.2 新词串统计	第34-35页
4.2.3 垃圾词串的过滤	第35页
4.2.4 结果排序与输出	第35-37页
4.3 小结	第37-38页
5 面向学科的新词发现系统的实现和应用	第38-57页
5.1 系统开发环境	第38页
5.2 实验功能模块实现	第38-52页
5.2.1 文本预处理	第38-41页
5.2.2 新词串统计	第41-46页
5.2.3 垃圾词串过滤	第46-50页
5.2.4 结果排序与输出	第50-52页
5.3 系统应用分析	第52-56页
5.4 小结	第56-57页
6 总结与展望	第57-59页
6.1 研究总结	第57-58页
6.2 问题与展望	第58-59页
参考文献	第59-62页
项目资助及发表论文情况	第62-63页
致谢	第63页