首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

中文新词检测与分析

摘要第1-4页
Abstract第4-7页
图目录第7-8页
表目录第8-9页
第一章 引言第9-15页
 1.1 背景第9页
 1.2 新词定义及分类第9-10页
 1.3 新词的特征第10-13页
  1.3.1 字面特征第10-11页
  1.3.2 分布特征第11-12页
  1.3.3 语义特征第12-13页
 1.4 本文的组织第13-15页
第二章 新词检测与分析研究现状第15-23页
 2.1 命名实体类新词识别的已有技术第15页
 2.2 普通新词的识别现状第15-18页
  2.2.1 以规则为主的新词检测第15-16页
  2.2.2 以统计为主的新词检测第16-18页
 2.3 新词分布特征研究现状第18-20页
 2.4 缩略语提取技术现状第20-21页
 2.5 小结第21-23页
第三章 中文新词检测第23-31页
 3.1 已有的工作基础第23页
 3.2 新词模式分析第23-24页
 3.3 垃圾串过滤方法第24-27页
 3.4 后处理第27-28页
 3.5 本方法的优缺点分析第28页
 3.6 实验结果及对比第28-30页
 3.7 小结第30-31页
第四章 新词分布特征研究第31-37页
 4.1 新词的分布特征第31页
 4.2 数据准备第31页
 4.3 新词的空间相关性第31-32页
  4.3.1 句子共现相关性的计算方法第32页
  4.3.2 篇章共现相关性的计算方法第32页
 4.4 新词的时间相关性第32-35页
 4.5 实验结果第35页
 4.6 小结第35-37页
第五章 缩略语自动抽取第37-43页
 5.1 主要步骤第37页
 5.2 提取候选缩略语集第37页
 5.3 提取候选源短语库第37-38页
 5.4 缩略语和源短语的对齐第38-40页
 5.5 实验结果及分析第40-42页
 5.6 小结第42-43页
第六章 在线新词检测与分析系统介绍第43-51页
 6.1 系统主要组成第43-44页
 6.2 后台服务器主要模块第44-48页
  6.2.1 网页采集第45页
  6.2.2 训练模块第45页
  6.2.3 网页处理第45页
  6.2.4 频度统计第45-46页
  6.2.5 垃圾串过滤模块第46-47页
  6.2.6 新词特征提取模块第47-48页
 6.3 Web 服务器脚本第48-49页
 6.4 系统结果第49-50页
 6.5 小结第50-51页
第七章 结论第51-53页
参考文献第53-55页
致谢第55-56页
作者简介第56页

论文共56页,点击 下载论文
上一篇:期待可能性理论的本土化价值
下一篇:基于GPU的串匹配算法的实现