中文新词检测与分析

摘要	第1-4页
Abstract	第4-7页
图目录	第7-8页
表目录	第8-9页
第一章引言	第9-15页
1．1 背景	第9页
1．2 新词定义及分类	第9-10页
1．3 新词的特征	第10-13页
1．3．1 字面特征	第10-11页
1．3．2 分布特征	第11-12页
1．3．3 语义特征	第12-13页
1．4 本文的组织	第13-15页
第二章新词检测与分析研究现状	第15-23页
2．1 命名实体类新词识别的已有技术	第15页
2．2 普通新词的识别现状	第15-18页
2．2．1 以规则为主的新词检测	第15-16页
2．2．2 以统计为主的新词检测	第16-18页
2．3 新词分布特征研究现状	第18-20页
2．4 缩略语提取技术现状	第20-21页
2．5 小结	第21-23页
第三章中文新词检测	第23-31页
3．1 已有的工作基础	第23页
3．2 新词模式分析	第23-24页
3．3 垃圾串过滤方法	第24-27页
3．4 后处理	第27-28页
3．5 本方法的优缺点分析	第28页
3．6 实验结果及对比	第28-30页
3．7 小结	第30-31页
第四章新词分布特征研究	第31-37页
4．1 新词的分布特征	第31页
4．2 数据准备	第31页
4．3 新词的空间相关性	第31-32页
4．3．1 句子共现相关性的计算方法	第32页
4．3．2 篇章共现相关性的计算方法	第32页
4．4 新词的时间相关性	第32-35页
4．5 实验结果	第35页
4．6 小结	第35-37页
第五章缩略语自动抽取	第37-43页
5．1 主要步骤	第37页
5．2 提取候选缩略语集	第37页
5．3 提取候选源短语库	第37-38页
5．4 缩略语和源短语的对齐	第38-40页
5．5 实验结果及分析	第40-42页
5．6 小结	第42-43页
第六章在线新词检测与分析系统介绍	第43-51页
6．1 系统主要组成	第43-44页
6．2 后台服务器主要模块	第44-48页
6．2．1 网页采集	第45页
6．2．2 训练模块	第45页
6．2．3 网页处理	第45页
6．2．4 频度统计	第45-46页
6．2．5 垃圾串过滤模块	第46-47页
6．2．6 新词特征提取模块	第47-48页
6．3 Web 服务器脚本	第48-49页
6．4 系统结果	第49-50页
6．5 小结	第50-51页
第七章结论	第51-53页
参考文献	第53-55页
致谢	第55-56页
作者简介	第56页