中文新词检测与分析
摘要 | 第1-4页 |
Abstract | 第4-7页 |
图目录 | 第7-8页 |
表目录 | 第8-9页 |
第一章 引言 | 第9-15页 |
1.1 背景 | 第9页 |
1.2 新词定义及分类 | 第9-10页 |
1.3 新词的特征 | 第10-13页 |
1.3.1 字面特征 | 第10-11页 |
1.3.2 分布特征 | 第11-12页 |
1.3.3 语义特征 | 第12-13页 |
1.4 本文的组织 | 第13-15页 |
第二章 新词检测与分析研究现状 | 第15-23页 |
2.1 命名实体类新词识别的已有技术 | 第15页 |
2.2 普通新词的识别现状 | 第15-18页 |
2.2.1 以规则为主的新词检测 | 第15-16页 |
2.2.2 以统计为主的新词检测 | 第16-18页 |
2.3 新词分布特征研究现状 | 第18-20页 |
2.4 缩略语提取技术现状 | 第20-21页 |
2.5 小结 | 第21-23页 |
第三章 中文新词检测 | 第23-31页 |
3.1 已有的工作基础 | 第23页 |
3.2 新词模式分析 | 第23-24页 |
3.3 垃圾串过滤方法 | 第24-27页 |
3.4 后处理 | 第27-28页 |
3.5 本方法的优缺点分析 | 第28页 |
3.6 实验结果及对比 | 第28-30页 |
3.7 小结 | 第30-31页 |
第四章 新词分布特征研究 | 第31-37页 |
4.1 新词的分布特征 | 第31页 |
4.2 数据准备 | 第31页 |
4.3 新词的空间相关性 | 第31-32页 |
4.3.1 句子共现相关性的计算方法 | 第32页 |
4.3.2 篇章共现相关性的计算方法 | 第32页 |
4.4 新词的时间相关性 | 第32-35页 |
4.5 实验结果 | 第35页 |
4.6 小结 | 第35-37页 |
第五章 缩略语自动抽取 | 第37-43页 |
5.1 主要步骤 | 第37页 |
5.2 提取候选缩略语集 | 第37页 |
5.3 提取候选源短语库 | 第37-38页 |
5.4 缩略语和源短语的对齐 | 第38-40页 |
5.5 实验结果及分析 | 第40-42页 |
5.6 小结 | 第42-43页 |
第六章 在线新词检测与分析系统介绍 | 第43-51页 |
6.1 系统主要组成 | 第43-44页 |
6.2 后台服务器主要模块 | 第44-48页 |
6.2.1 网页采集 | 第45页 |
6.2.2 训练模块 | 第45页 |
6.2.3 网页处理 | 第45页 |
6.2.4 频度统计 | 第45-46页 |
6.2.5 垃圾串过滤模块 | 第46-47页 |
6.2.6 新词特征提取模块 | 第47-48页 |
6.3 Web 服务器脚本 | 第48-49页 |
6.4 系统结果 | 第49-50页 |
6.5 小结 | 第50-51页 |
第七章 结论 | 第51-53页 |
参考文献 | 第53-55页 |
致谢 | 第55-56页 |
作者简介 | 第56页 |