基于Web的领域词典构建技术研究

摘要	第1-5页
Abstract	第5-10页
第1章绪论	第10-16页
·课题研究的背景及意义	第10-11页
·国内外对领域术语自动获取的研究	第11-14页
·国外的研究状况	第11-13页
·国内的研究状况	第13-14页
·主要工作与本文组织	第14-16页
第2章关于术语的相关概念	第16-24页
·术语与术语学	第16-19页
·术语的特征	第19-23页
·术语的领域特征	第19页
·术语的结构特征	第19-20页
·术语的单元性(Unithood)与术语性(Termhood)	第20-21页
·简单术语与复杂术语	第21-22页
·术语的内部特征与外部特征	第22-23页
·本章小结	第23-24页
第3章基于互联网的领域词典构建的关键技术	第24-40页
·面向领域主题的信息采集相关研究	第24-27页
·主题的描述	第25页
·网页内容与主题相关性的判定	第25-26页
·URL与主题的相关性预测	第26-27页
·领域语料内容的预处理相关研究	第27-31页
·网页规范化处理	第27-28页
·网页形式化表示	第28-29页
·网页节点选择	第29-31页
·领域新词发现相关研究	第31-34页
·上下文邻接分析	第32-33页
·独立成词概率	第33页
·位置成词概率	第33页
·双字耦合度	第33-34页
·领域特征词抽取相关研究	第34-39页
·领域术语抽取标准	第35-36页
·符号定义	第36页
·信息熵	第36-37页
·正规化的类间分布熵	第37-38页
·正规化的类内分布熵	第38页
·词语的排序公式	第38-39页
·本章小结	第39-40页
第4章 Web术语抽取系统的设计与实现	第40-51页
·系统功能	第40页
·系统总体架构	第40-41页
·主题信息采集的实现	第41-43页
·网页正文抽取的实现	第43-44页
·预处理	第43页
·噪声过滤	第43-44页
·正文抽取	第44页
·领域新词发现的实现	第44-47页
·训练模块	第44-45页
·频度统计	第45-47页
·垃圾串过滤	第47页
·领域特征词抽取的实现	第47-50页
·本章小结	第50-51页
第5章系统功能评测	第51-59页
·针对主题过滤模块的评测	第51-52页
·针对正文抽取模块的评测	第52-53页
·针对领域新词发现模块的评测	第53-56页
·小规模语料测试	第53-55页
·分词实验	第55-56页
·针对领域特征词抽取模块的评测	第56-58页
·特征词精度测试	第56-57页
·文本分类实验	第57-58页
·本章小结	第58-59页
结论	第59-61页
参考文献	第61-66页
致谢	第66页