Web文本挖掘中若干问题的研究
| 摘要 | 第1-7页 |
| ABSTRACT | 第7-12页 |
| 第一章 绪论 | 第12-28页 |
| ·课题的研究背景和意义 | 第12-13页 |
| ·文本分类、检索及复杂网络概述 | 第13-19页 |
| ·文本分类概述 | 第13-16页 |
| ·文本检索概述 | 第16-18页 |
| ·复杂网络概述 | 第18-19页 |
| ·Web文本挖掘的若干关键问题 | 第19-22页 |
| ·本文的工作 | 第22-26页 |
| ·本文的创新点 | 第22-23页 |
| ·本文的结构安排 | 第23-26页 |
| 本章参考文献 | 第26-28页 |
| 第二章 多类文本分类 | 第28-48页 |
| ·引言 | 第28页 |
| ·常用的文本分类算法 | 第28-32页 |
| ·支持向量机多类分类 | 第32-36页 |
| ·基于SVM和概率纠错输出编码的多类分类算法 | 第36-39页 |
| ·概率化SVM决策函数值 | 第36-37页 |
| ·类序列概率计算法解码 | 第37-38页 |
| ·求编码矩阵伪逆法解码 | 第38-39页 |
| ·实验及分析 | 第39-45页 |
| ·第一种解码算法实验 | 第39-43页 |
| ·第二种解码算法实验 | 第43-45页 |
| ·本章小结 | 第45-46页 |
| 本章参考文献 | 第46-48页 |
| 第三章 演进式垃圾短信过滤 | 第48-70页 |
| ·引言 | 第48-49页 |
| ·常用的垃圾短信过滤算法 | 第49-52页 |
| ·简单规则拦截 | 第49-50页 |
| ·基于统计学习的算法 | 第50-52页 |
| ·演进式垃圾短信过滤基本方法和系统 | 第52-59页 |
| ·获取用户反馈 | 第52-54页 |
| ·自适应学习 | 第54-56页 |
| ·进化学习 | 第56-58页 |
| ·演进式垃圾短信过滤基本系统 | 第58-59页 |
| ·基于中间层映射的短信过滤 | 第59-66页 |
| ·训练多类映射参数 | 第60-61页 |
| ·中间层映射 | 第61-63页 |
| ·实验及分析 | 第63-66页 |
| ·本章小结 | 第66-67页 |
| 本章参考文献 | 第67-70页 |
| 第四章 Web实体检索研究 | 第70-92页 |
| ·引言 | 第70页 |
| ·实体检索相关研究 | 第70-72页 |
| ·TREC实体检索评测 | 第72-83页 |
| ·相关实体查找 | 第72-78页 |
| ·实体列表补全 | 第78-81页 |
| ·实验及分析 | 第81-83页 |
| ·利用语义类别标签改进实体检索系统 | 第83-86页 |
| ·引入语义类别标签 | 第83-84页 |
| ·实验结果和分析 | 第84-86页 |
| ·校园对象搜索引擎系统 | 第86页 |
| ·小结 | 第86-88页 |
| 本章参考文献 | 第88-92页 |
| 第五章 基于复杂网络的Web文本挖掘 | 第92-118页 |
| ·引言 | 第92-93页 |
| ·基于激活力和亲和度的词网络建模算法 | 第93-100页 |
| ·常见的语义空间建模算法 | 第93-95页 |
| ·词的激活效应和激活力 | 第95-97页 |
| ·词的亲和度测度 | 第97-100页 |
| ·基于激活力和亲和度的蛋白质关联分析 | 第100-105页 |
| ·蛋白质相互作用网络分析 | 第100-101页 |
| ·蛋白质的聚类分析 | 第101-105页 |
| ·基于激活力和亲和度的文本表示和分类 | 第105-112页 |
| ·基于激活力和亲和度的文本表示 | 第105-108页 |
| ·基于激活力和亲和度的分类算法 | 第108-110页 |
| ·实验及分析 | 第110-112页 |
| ·基于亲和度的实体检索重排序 | 第112-114页 |
| ·实体的亲和度 | 第112-113页 |
| ·利用实体亲和度重排序 | 第113-114页 |
| ·本章小结 | 第114-115页 |
| 本章参考文献 | 第115-118页 |
| 第六章 结束语 | 第118-122页 |
| ·本文的工作总结 | 第118-119页 |
| ·未来的工作展望 | 第119-122页 |
| 致谢 | 第122-124页 |
| 攻读博士学位期间发表的学术论文 | 第124-126页 |
| 攻读博士学位期间公开的国家专利 | 第126页 |