基于语义扩展的信息抽取技术研究
摘要 | 第1-6页 |
ABSTRACT | 第6-11页 |
第1章 绪论 | 第11-18页 |
·目的和意义 | 第11-12页 |
·系统框图 | 第12-13页 |
·基于语义空间扩展技术的语音文档检索的研究现状 | 第13-16页 |
·语音文档检索技术简介 | 第13-14页 |
·文本特征提取技术简介 | 第14-15页 |
·查询词扩展技术简介 | 第15-16页 |
·论文的研究内容及章节安排 | 第16-18页 |
第2章 语音识别平台 | 第18-28页 |
·前言 | 第18页 |
·语音文件的前处理 | 第18-23页 |
·隐马尔科夫模型(HMM) | 第18-20页 |
·HTK工具 | 第20-21页 |
·Lattice的应用 | 第21-22页 |
·Lattice的概念及表示 | 第22-23页 |
·语音文件的后处理 | 第23-27页 |
·查询似然检索模型 | 第23-25页 |
·结合Lattice的检索模型 | 第25-27页 |
·本章小结 | 第27-28页 |
第3章 文本特征提取技术 | 第28-46页 |
·前言 | 第28页 |
·预处理 | 第28-29页 |
·中文文本分词 | 第28-29页 |
·去停用词 | 第29页 |
·文本特征提取技术 | 第29-34页 |
·传统的特征提取方法 | 第29-31页 |
·本文选取的三种基本特征提取方法 | 第31-34页 |
·引入权值的语音识别平台 | 第34-40页 |
·改进的语音识别平台 | 第34-36页 |
·引入权值的语音识别平台的C数据结构实现 | 第36-40页 |
·混合特征法 | 第40-44页 |
·本章小结 | 第44-46页 |
第4章 查询词扩展技术 | 第46-60页 |
·前言 | 第46页 |
·现有的主要查询扩展方法 | 第46-50页 |
·全局分析 | 第47页 |
·局部分析 | 第47-48页 |
·局部上下文分析 | 第48页 |
·基于用户日志的查询扩展 | 第48-50页 |
·基于最相关扩展词的关键信息扩展技术 | 第50-52页 |
·基于热度因子的关键信息扩展技术 | 第52-57页 |
·最相关文本数和较相关文本数 | 第52-53页 |
·热度因子 | 第53-57页 |
·基于热度因子的关键信息扩展技术的程序流程 | 第57-59页 |
·本章小结 | 第59-60页 |
第5章 实验与结果分析 | 第60-70页 |
·实验的基本设置 | 第60-62页 |
·实验语料集 | 第60-61页 |
·标准文档集 | 第61页 |
·评测标准—未插值平均准确率 | 第61-62页 |
·特征提取技术实验结果展示 | 第62-67页 |
·三种基本特征的检索结果 | 第62-63页 |
·加入文件长度信息的语音识别平台 | 第63-64页 |
·加入权值信息的语音识别平台 | 第64-65页 |
·混合特征检索结果 | 第65-67页 |
·查询扩展技术实验结果展示 | 第67-69页 |
·本章小结 | 第69-70页 |
结论 | 第70-71页 |
参考文献 | 第71-76页 |
攻读硕士学位期间发表的论文和取得的科研成果 | 第76-77页 |
致谢 | 第77页 |