面向Web个性化服务的网页分类技术
| 摘要 | 第1-4页 |
| ABSTRACT | 第4-8页 |
| 1 绪论 | 第8-13页 |
| ·WEB 个性化服务技术 | 第8-9页 |
| ·背景与意义 | 第8页 |
| ·技术基础 | 第8-9页 |
| ·中文网页自动分类技术 | 第9-11页 |
| ·背景与意义 | 第9-10页 |
| ·问题描述 | 第10页 |
| ·国内外研究现状 | 第10页 |
| ·技术基础和面临的问题 | 第10-11页 |
| ·本文的主要内容和研究意义 | 第11-13页 |
| 2 网页正文提取与特征词加权 | 第13-22页 |
| ·网页表示 | 第13-14页 |
| ·布尔模型 | 第13页 |
| ·概率模型 | 第13页 |
| ·向量空间模型 | 第13-14页 |
| ·网页正文提取 | 第14-18页 |
| ·网页标签分析 | 第14-16页 |
| ·基于网页标签分析的内容提取算法 | 第16-18页 |
| ·网页特征词综合加权方法 | 第18-22页 |
| ·常见的网页特征词加权方法 | 第18-19页 |
| ·综合网页加权方法 | 第19-22页 |
| 3 聚类树支持向量机CT-SVM | 第22-39页 |
| ·支持向量机简介 | 第23-28页 |
| ·统计学习理论 | 第23-24页 |
| ·分类超平面与类间隔最大化 | 第24-25页 |
| ·非线性可分与核函数 | 第25-26页 |
| ·多类分类 | 第26-28页 |
| ·层次聚类树的构造 | 第28-34页 |
| ·层次聚类树CT | 第28-31页 |
| ·考虑用户兴趣的类间相似度 | 第31-34页 |
| ·CT 参数选择与时间复杂度 | 第34页 |
| ·层次聚类树支持向量机CT-SVM | 第34-39页 |
| ·CT-SVM 算法描述 | 第34-37页 |
| ·CT-SVM 算法复杂性分析 | 第37-39页 |
| 4 基于文本语义相似度的分类核函数 | 第39-48页 |
| ·核函数的构造与网页相似度 | 第39-40页 |
| ·基于知网语义的最大权匹配文本相似度算法SHM | 第40-45页 |
| ·《知网》简介 | 第40-41页 |
| ·词汇语义相似度计算 | 第41-42页 |
| ·文档二部图最大权匹配计算 | 第42-43页 |
| ·基于语义的文本相似度算法SHM | 第43-45页 |
| ·基于SHM 算法的文本语义核函数 | 第45-48页 |
| 5 实验与分析 | 第48-57页 |
| ·综合网页特征词加权方法实验 | 第48-49页 |
| ·数据集和实验环境 | 第48页 |
| ·实验结果和评价 | 第48-49页 |
| ·CT-SVM 有效性实验 | 第49-53页 |
| ·CT-SVM 时间性能实验 | 第50-51页 |
| ·CT-SVM 分类效果实验 | 第51-52页 |
| ·分析与结论 | 第52-53页 |
| ·文本语义核CT-SVM 有效性实验 | 第53-57页 |
| ·语义核CT-SVM 分类效果实验 | 第53-54页 |
| ·语义核CT-SVM 时间性能实验 | 第54-55页 |
| ·分析与结论 | 第55-57页 |
| 6 总结与展望 | 第57-59页 |
| ·论文研究内容 | 第57页 |
| ·论文创新点总结 | 第57-58页 |
| ·未来的研究展望 | 第58-59页 |
| 致谢 | 第59-60页 |
| 参考文献 | 第60-64页 |
| 附录 | 第64页 |