摘要 | 第1-12页 |
ABSTRACT | 第12-15页 |
符号使用说明 | 第15-16页 |
第一章 绪论 | 第16-42页 |
·研究背景 | 第16-17页 |
·相关研究工作与挑战 | 第17-36页 |
·问题描述 | 第17-18页 |
·大规模层次分类问题的解决策略 | 第18-20页 |
·全局分类方法 | 第20-25页 |
·自上而下的分类方法 | 第25-29页 |
·收缩分类方法 | 第29-30页 |
·大规模层次分类方法的评价和比较 | 第30-35页 |
·面向互联网文本的大规模层次分类的挑战 | 第35-36页 |
·本文的工作与创新 | 第36-40页 |
·主要研究工作 | 第37-38页 |
·主要创新点 | 第38-40页 |
·论文结构 | 第40-42页 |
第二章 基于候选类别搜索的两阶段分类方法 | 第42-58页 |
·问题描述 | 第43-44页 |
·相关研究 | 第44-45页 |
·候选搜索问题的计算复杂性分析 | 第45-47页 |
·基于Correct-Error贪心策略的启发式候选搜索算法 | 第47-49页 |
·实验分析 | 第49-55页 |
·数据预处理 | 第49-50页 |
·特征选择 | 第50-52页 |
·候选搜索 | 第52-54页 |
·结合祖先类别的分类 | 第54-55页 |
·本章小结 | 第55-58页 |
第三章 主题目录中的稀有类别分类方法 | 第58-70页 |
·问题描述 | 第58-59页 |
·相关研究 | 第59-60页 |
·方法 | 第60-64页 |
·Latent Dirichlet Allocation | 第61-62页 |
·基于LDA的层次式分类模型 | 第62-64页 |
·实验分析 | 第64-67页 |
·实验准备 | 第64-65页 |
·模型介绍 | 第65页 |
·实验结果 | 第65-67页 |
·本章小结 | 第67-70页 |
第四章 基于无标记数据的层次式文本分类 | 第70-78页 |
·问题描述 | 第70-71页 |
·相关研究 | 第71-72页 |
·基于无标记web数据的HSVM分类模型 | 第72-73页 |
·获取web样本 | 第72-73页 |
·学习分类器 | 第73页 |
·实验分析 | 第73-76页 |
·实验准备 | 第73-75页 |
·实验结果 | 第75-76页 |
·本章小结 | 第76-78页 |
第五章 基于概率主题模型的社会化文本分类 | 第78-100页 |
·问题描述 | 第78-79页 |
·相关研究 | 第79-80页 |
·微博用户兴趣挖掘方法 | 第80-85页 |
·用户主题模型 | 第80-83页 |
·模型推导 | 第83-84页 |
·用户兴趣挖掘 | 第84-85页 |
·微博用户分类方法 | 第85-89页 |
·uLTM模型 | 第85-87页 |
·模型推导 | 第87-88页 |
·基于uLTM的用户分类 | 第88-89页 |
·用户兴趣挖掘实验分析 | 第89-94页 |
·实验准备 | 第89页 |
·实验结果 | 第89-94页 |
·用户分类实验分析 | 第94-97页 |
·实验准备 | 第94-95页 |
·评价准则和模型介绍 | 第95-96页 |
·实验结果 | 第96-97页 |
·本章小结 | 第97-100页 |
第六章 结论与展望 | 第100-104页 |
·工作总结 | 第100-102页 |
·研究展望 | 第102-104页 |
致谢 | 第104-106页 |
参考文献 | 第106-116页 |
作者在学期间取得的学术成果 | 第116-118页 |
攻读博士学位期间参与的科研项目 | 第118页 |