面向Web个性化服务的网页分类技术
摘要 | 第1-4页 |
ABSTRACT | 第4-8页 |
1 绪论 | 第8-13页 |
·WEB 个性化服务技术 | 第8-9页 |
·背景与意义 | 第8页 |
·技术基础 | 第8-9页 |
·中文网页自动分类技术 | 第9-11页 |
·背景与意义 | 第9-10页 |
·问题描述 | 第10页 |
·国内外研究现状 | 第10页 |
·技术基础和面临的问题 | 第10-11页 |
·本文的主要内容和研究意义 | 第11-13页 |
2 网页正文提取与特征词加权 | 第13-22页 |
·网页表示 | 第13-14页 |
·布尔模型 | 第13页 |
·概率模型 | 第13页 |
·向量空间模型 | 第13-14页 |
·网页正文提取 | 第14-18页 |
·网页标签分析 | 第14-16页 |
·基于网页标签分析的内容提取算法 | 第16-18页 |
·网页特征词综合加权方法 | 第18-22页 |
·常见的网页特征词加权方法 | 第18-19页 |
·综合网页加权方法 | 第19-22页 |
3 聚类树支持向量机CT-SVM | 第22-39页 |
·支持向量机简介 | 第23-28页 |
·统计学习理论 | 第23-24页 |
·分类超平面与类间隔最大化 | 第24-25页 |
·非线性可分与核函数 | 第25-26页 |
·多类分类 | 第26-28页 |
·层次聚类树的构造 | 第28-34页 |
·层次聚类树CT | 第28-31页 |
·考虑用户兴趣的类间相似度 | 第31-34页 |
·CT 参数选择与时间复杂度 | 第34页 |
·层次聚类树支持向量机CT-SVM | 第34-39页 |
·CT-SVM 算法描述 | 第34-37页 |
·CT-SVM 算法复杂性分析 | 第37-39页 |
4 基于文本语义相似度的分类核函数 | 第39-48页 |
·核函数的构造与网页相似度 | 第39-40页 |
·基于知网语义的最大权匹配文本相似度算法SHM | 第40-45页 |
·《知网》简介 | 第40-41页 |
·词汇语义相似度计算 | 第41-42页 |
·文档二部图最大权匹配计算 | 第42-43页 |
·基于语义的文本相似度算法SHM | 第43-45页 |
·基于SHM 算法的文本语义核函数 | 第45-48页 |
5 实验与分析 | 第48-57页 |
·综合网页特征词加权方法实验 | 第48-49页 |
·数据集和实验环境 | 第48页 |
·实验结果和评价 | 第48-49页 |
·CT-SVM 有效性实验 | 第49-53页 |
·CT-SVM 时间性能实验 | 第50-51页 |
·CT-SVM 分类效果实验 | 第51-52页 |
·分析与结论 | 第52-53页 |
·文本语义核CT-SVM 有效性实验 | 第53-57页 |
·语义核CT-SVM 分类效果实验 | 第53-54页 |
·语义核CT-SVM 时间性能实验 | 第54-55页 |
·分析与结论 | 第55-57页 |
6 总结与展望 | 第57-59页 |
·论文研究内容 | 第57页 |
·论文创新点总结 | 第57-58页 |
·未来的研究展望 | 第58-59页 |
致谢 | 第59-60页 |
参考文献 | 第60-64页 |
附录 | 第64页 |