摘要 | 第5-7页 |
Abstract | 第7-8页 |
第一章 概论 | 第12-23页 |
1.1 研究的对象 | 第12页 |
1.1.1 复合词的定义 | 第12页 |
1.1.2 本文的主要研究对象 | 第12页 |
1.2 研究的动因和意义 | 第12-14页 |
1.3 复合词分析的现状 | 第14-17页 |
1.4 信息检索的现状 | 第17-21页 |
1.4.1 网络信息检索技术的特点 | 第17-18页 |
1.4.2 网络信息检索技术的分类 | 第18-21页 |
1.5 本文各个章节的安排 | 第21-23页 |
第二章 一般复合词分析的理论方法 | 第23-28页 |
2.1 基于统计学的方法 | 第23-26页 |
2.1.1 频率 | 第23-24页 |
2.1.2 假设检验 | 第24页 |
2.1.3 似然比(log-likelihood ratio) | 第24-26页 |
2.1.4 相对频率比(relative frequency ratio) | 第26页 |
2.2 基于规则 | 第26-27页 |
2.3 统计和规则相结合的方法 | 第27页 |
2.4 本章小结 | 第27-28页 |
第三章 动词名物化识别 | 第28-39页 |
3.1 动词名物化与复合词识别 | 第28-31页 |
3.1.1 动词名物化 | 第28-31页 |
3.1.2 动词名物化对复合词识别判断的意义 | 第31页 |
3.2 动词名物化识别中的问题 | 第31-32页 |
3.4 最大熵模型 | 第32-33页 |
3.5 模型的特征模板 | 第33-36页 |
3.6 实验结果及分析 | 第36-38页 |
3.7 本章小结 | 第38-39页 |
第四章 名物化复合词识别 | 第39-46页 |
4.1 名词性复合词与名物化复合词 | 第39页 |
4.2 基准系统(BASELINE SYSTEM) | 第39-40页 |
4.2.1 数据集 | 第39-40页 |
4.2.2 基准系统所采用的特征 | 第40页 |
4.3 系统改进 | 第40-44页 |
4.3.1 基于主题词表的特征 | 第40-41页 |
4.3.2 Web 特征 | 第41-42页 |
4.3.3 基于信息检索的点式互信息(PMI-IR) | 第42-43页 |
4.3.4 特征表现 | 第43-44页 |
4.4 不同分类算法的比较 | 第44-45页 |
4.5 本章小结 | 第45-46页 |
第五章 复合词分析在 WEB 检索中的应用 | 第46-54页 |
5.1 传统的 WEB 检索 | 第46-48页 |
5.2 本章所针对对象 | 第48-49页 |
5.3 基于 NVN 复合词结构检索的优势 | 第49-51页 |
5.4 数据集 | 第51页 |
5.5 实验所采用的方法 | 第51-52页 |
5.6 实验评价方法 | 第52页 |
5.7 实验结果及其分析 | 第52-53页 |
5.8 本章小结 | 第53-54页 |
第六章 全文总结 | 第54-56页 |
6.1 主要结论 | 第54页 |
6.2 研究展望 | 第54-56页 |
参考文献 | 第56-59页 |
致谢 | 第59-60页 |
攻读硕士学位期间已发表或录用的论文 | 第60页 |