大规模文档标签自动标注技术研究

摘要	第1-6页
ABSTRACT	第6-14页
第1章绪论	第14-32页
·课题背景及意义	第14-15页
·分众分类学概述	第15-20页
·简介	第15-18页
·分众分类学的应用实例	第18-19页
·分众分类学在其他领域的应用	第19-20页
·本文研究内容及相关工作	第20-30页
·分众分类学研究热点	第20-22页
·研究内容概述	第22-26页
·研究现状	第26-30页
·本文的内容安排	第30-32页
第2章基于统计语言模型的排序标注技术	第32-63页
·统计语言模型概述	第32-34页
·排序标注语言模型	第34-37页
·文档似然标注模型	第35-36页
·分布距离标注模型	第36-37页
·排序标注语言模型的估值方法	第37-43页
·最大似然估计法	第37-39页
·常用的平滑策略	第39-41页
·基于混合模型的排序标注语言模型估值方法	第41-43页
·实验	第43-61页
·实验设计	第43-50页
·文档似然标注模型实验与讨论	第50-55页
·分布距离标注模型实验与讨论	第55-58页
·混合模型估值实验与讨论	第58-61页
·本章小结	第61-63页
第3章面向大规模文档的标注效率优化技术	第63-76页
·候选生成策略讨论	第63-67页
·候选生成技术	第67-70页
·基于标签共现的候选生成算法	第67-69页
·基于内容抽取的候选生成算法	第69-70页
·实验	第70-72页
·候选生成模块验证实验	第70-71页
·扩展候选生成算法验证实验与讨论	第71-72页
·本章小结	第72-76页
第4章标签质量评估技术	第76-88页
·标签质量评估方法	第76-80页
·基于明晰度的标签质量评估方法	第77页
·基于特征选择的标签质量评估方法	第77-80页
·标签排序融合技术	第80-82页
·实验	第82-87页
·优质标签集构建实验	第82-85页
·标签排序融合实验	第85-87页
·本章小结	第87-88页
第5章基于最小描述标签集的自动标注技术	第88-103页
·基于最小描述标签集的自动标注问题	第88-93页
·调色标注算法	第93页
·面向文档的描述函数建模及估值问题	第93-98页
·基于概率插值的标签集语义模型估值方法	第96页
·基于模糊文档集的标签集语义模型	第96-98页
·实验	第98-101页
·实验设计	第98-99页
·标签集生成实验	第99-101页
·本章小结	第101-103页
结论	第103-105页
参考文献	第105-117页
攻读博士学位期间发表的论文及其他成果	第117-119页
致谢	第119-120页
个人简历	第120页