Web文本挖掘中若干问题的研究

摘要	第1-7页
ABSTRACT	第7-12页
第一章绪论	第12-28页
·课题的研究背景和意义	第12-13页
·文本分类、检索及复杂网络概述	第13-19页
·文本分类概述	第13-16页
·文本检索概述	第16-18页
·复杂网络概述	第18-19页
·Web文本挖掘的若干关键问题	第19-22页
·本文的工作	第22-26页
·本文的创新点	第22-23页
·本文的结构安排	第23-26页
本章参考文献	第26-28页
第二章多类文本分类	第28-48页
·引言	第28页
·常用的文本分类算法	第28-32页
·支持向量机多类分类	第32-36页
·基于SVM和概率纠错输出编码的多类分类算法	第36-39页
·概率化SVM决策函数值	第36-37页
·类序列概率计算法解码	第37-38页
·求编码矩阵伪逆法解码	第38-39页
·实验及分析	第39-45页
·第一种解码算法实验	第39-43页
·第二种解码算法实验	第43-45页
·本章小结	第45-46页
本章参考文献	第46-48页
第三章演进式垃圾短信过滤	第48-70页
·引言	第48-49页
·常用的垃圾短信过滤算法	第49-52页
·简单规则拦截	第49-50页
·基于统计学习的算法	第50-52页
·演进式垃圾短信过滤基本方法和系统	第52-59页
·获取用户反馈	第52-54页
·自适应学习	第54-56页
·进化学习	第56-58页
·演进式垃圾短信过滤基本系统	第58-59页
·基于中间层映射的短信过滤	第59-66页
·训练多类映射参数	第60-61页
·中间层映射	第61-63页
·实验及分析	第63-66页
·本章小结	第66-67页
本章参考文献	第67-70页
第四章 Web实体检索研究	第70-92页
·引言	第70页
·实体检索相关研究	第70-72页
·TREC实体检索评测	第72-83页
·相关实体查找	第72-78页
·实体列表补全	第78-81页
·实验及分析	第81-83页
·利用语义类别标签改进实体检索系统	第83-86页
·引入语义类别标签	第83-84页
·实验结果和分析	第84-86页
·校园对象搜索引擎系统	第86页
·小结	第86-88页
本章参考文献	第88-92页
第五章基于复杂网络的Web文本挖掘	第92-118页
·引言	第92-93页
·基于激活力和亲和度的词网络建模算法	第93-100页
·常见的语义空间建模算法	第93-95页
·词的激活效应和激活力	第95-97页
·词的亲和度测度	第97-100页
·基于激活力和亲和度的蛋白质关联分析	第100-105页
·蛋白质相互作用网络分析	第100-101页
·蛋白质的聚类分析	第101-105页
·基于激活力和亲和度的文本表示和分类	第105-112页
·基于激活力和亲和度的文本表示	第105-108页
·基于激活力和亲和度的分类算法	第108-110页
·实验及分析	第110-112页
·基于亲和度的实体检索重排序	第112-114页
·实体的亲和度	第112-113页
·利用实体亲和度重排序	第113-114页
·本章小结	第114-115页
本章参考文献	第115-118页
第六章结束语	第118-122页
·本文的工作总结	第118-119页
·未来的工作展望	第119-122页
致谢	第122-124页
攻读博士学位期间发表的学术论文	第124-126页
攻读博士学位期间公开的国家专利	第126页