Web文本挖掘中若干问题的研究
摘要 | 第1-7页 |
ABSTRACT | 第7-12页 |
第一章 绪论 | 第12-28页 |
·课题的研究背景和意义 | 第12-13页 |
·文本分类、检索及复杂网络概述 | 第13-19页 |
·文本分类概述 | 第13-16页 |
·文本检索概述 | 第16-18页 |
·复杂网络概述 | 第18-19页 |
·Web文本挖掘的若干关键问题 | 第19-22页 |
·本文的工作 | 第22-26页 |
·本文的创新点 | 第22-23页 |
·本文的结构安排 | 第23-26页 |
本章参考文献 | 第26-28页 |
第二章 多类文本分类 | 第28-48页 |
·引言 | 第28页 |
·常用的文本分类算法 | 第28-32页 |
·支持向量机多类分类 | 第32-36页 |
·基于SVM和概率纠错输出编码的多类分类算法 | 第36-39页 |
·概率化SVM决策函数值 | 第36-37页 |
·类序列概率计算法解码 | 第37-38页 |
·求编码矩阵伪逆法解码 | 第38-39页 |
·实验及分析 | 第39-45页 |
·第一种解码算法实验 | 第39-43页 |
·第二种解码算法实验 | 第43-45页 |
·本章小结 | 第45-46页 |
本章参考文献 | 第46-48页 |
第三章 演进式垃圾短信过滤 | 第48-70页 |
·引言 | 第48-49页 |
·常用的垃圾短信过滤算法 | 第49-52页 |
·简单规则拦截 | 第49-50页 |
·基于统计学习的算法 | 第50-52页 |
·演进式垃圾短信过滤基本方法和系统 | 第52-59页 |
·获取用户反馈 | 第52-54页 |
·自适应学习 | 第54-56页 |
·进化学习 | 第56-58页 |
·演进式垃圾短信过滤基本系统 | 第58-59页 |
·基于中间层映射的短信过滤 | 第59-66页 |
·训练多类映射参数 | 第60-61页 |
·中间层映射 | 第61-63页 |
·实验及分析 | 第63-66页 |
·本章小结 | 第66-67页 |
本章参考文献 | 第67-70页 |
第四章 Web实体检索研究 | 第70-92页 |
·引言 | 第70页 |
·实体检索相关研究 | 第70-72页 |
·TREC实体检索评测 | 第72-83页 |
·相关实体查找 | 第72-78页 |
·实体列表补全 | 第78-81页 |
·实验及分析 | 第81-83页 |
·利用语义类别标签改进实体检索系统 | 第83-86页 |
·引入语义类别标签 | 第83-84页 |
·实验结果和分析 | 第84-86页 |
·校园对象搜索引擎系统 | 第86页 |
·小结 | 第86-88页 |
本章参考文献 | 第88-92页 |
第五章 基于复杂网络的Web文本挖掘 | 第92-118页 |
·引言 | 第92-93页 |
·基于激活力和亲和度的词网络建模算法 | 第93-100页 |
·常见的语义空间建模算法 | 第93-95页 |
·词的激活效应和激活力 | 第95-97页 |
·词的亲和度测度 | 第97-100页 |
·基于激活力和亲和度的蛋白质关联分析 | 第100-105页 |
·蛋白质相互作用网络分析 | 第100-101页 |
·蛋白质的聚类分析 | 第101-105页 |
·基于激活力和亲和度的文本表示和分类 | 第105-112页 |
·基于激活力和亲和度的文本表示 | 第105-108页 |
·基于激活力和亲和度的分类算法 | 第108-110页 |
·实验及分析 | 第110-112页 |
·基于亲和度的实体检索重排序 | 第112-114页 |
·实体的亲和度 | 第112-113页 |
·利用实体亲和度重排序 | 第113-114页 |
·本章小结 | 第114-115页 |
本章参考文献 | 第115-118页 |
第六章 结束语 | 第118-122页 |
·本文的工作总结 | 第118-119页 |
·未来的工作展望 | 第119-122页 |
致谢 | 第122-124页 |
攻读博士学位期间发表的学术论文 | 第124-126页 |
攻读博士学位期间公开的国家专利 | 第126页 |