基于条件随机场的中文图书主题自动标引研究
摘要 | 第1-6页 |
ABSTRACT | 第6-9页 |
第1章 绪论 | 第9-15页 |
·研究背景 | 第9-12页 |
·图书主题标引的优势 | 第12-13页 |
·图书主题自动标引模型的评测方法 | 第13页 |
·本文组织结构 | 第13-15页 |
第2章 相关理论和模型 | 第15-27页 |
·信息抽取的主要方法 | 第15-18页 |
·朴素贝叶斯模型 | 第18-19页 |
·隐马尔可夫模型 | 第19-21页 |
·最大熵模型 | 第21-23页 |
·条件随机场模型 | 第23-27页 |
第3章 中文图书主题自动标引模型 | 第27-39页 |
·书目自动标引模型的构建 | 第28-29页 |
·字角色空间定义 | 第29-30页 |
·文本预处理和序列标注 | 第30-32页 |
·特征模板构建 | 第32-34页 |
·特征函数权重训练 | 第34-37页 |
·中文图书主题自动标引 | 第37-39页 |
第4章 实验结果与分析 | 第39-50页 |
·实验环境和数据准备 | 第39-40页 |
·训练集大小的影响 | 第40-42页 |
·特征模板字长窗口的影响 | 第42-43页 |
·模板特征元数的影响 | 第43-44页 |
·特征函数频次阈值的影响 | 第44-45页 |
·软边界参数的影响 | 第45-46页 |
·不同观察特征角色的影响 | 第46-50页 |
第5章 总结和展望 | 第50-53页 |
·本文小结 | 第50-51页 |
·中文图书主题自动标引展望 | 第51-53页 |
参考文献 | 第53-55页 |
致谢 | 第55页 |