基于个性化搜索的网页特征提取相关技术的研究
摘要 | 第1-7页 |
Abstract | 第7-13页 |
1 绪论 | 第13-18页 |
·个性化服务简介 | 第13-14页 |
·选题背景及研究意义 | 第14-16页 |
·论文组织结构 | 第16-17页 |
·本章小结 | 第17-18页 |
2 相关知识介绍 | 第18-29页 |
·网络蜘蛛 | 第18-20页 |
·网页正文提取方法 | 第20-24页 |
·网页正文分词方法 | 第24-25页 |
·网页特征描述现状 | 第25-27页 |
·本章小结 | 第27-29页 |
3 基于HTML元素的网页正文提取算法改进 | 第29-38页 |
·基于HTML元素的网页正文提取算法 | 第29-34页 |
·基于超链接的网页正文提取算法 | 第34-37页 |
·本章小结 | 第37-38页 |
4 基于兴趣词典的网页分词方法 | 第38-45页 |
·兴趣词典 | 第38-41页 |
·基于兴趣词典的网页分词方法设计 | 第41-43页 |
·兴趣词典的更新 | 第43-44页 |
·本章小结 | 第44-45页 |
5 网页特征词的权重计算算法改进 | 第45-54页 |
·传统的词语权重计算 | 第45-47页 |
·基于HTML标记的TF-IDF改进计算方法 | 第47-50页 |
·网页特征描述生成 | 第50-53页 |
·本章小结 | 第53-54页 |
6 基于个性化搜索引擎插件的测试 | 第54-65页 |
·个性化搜索引擎MyPSE | 第54-56页 |
·测试系统平台的构建及测试方案 | 第56-59页 |
·基于超链接的网页正文提取算法测试 | 第59-61页 |
·兴趣词典准确性和有效性测试 | 第61-62页 |
·网页特征词权重计算对比测试 | 第62-64页 |
·本章小结 | 第64-65页 |
7 总结与展望 | 第65-67页 |
·研究总结 | 第65页 |
·研究展望 | 第65-67页 |
致谢 | 第67-68页 |
攻读硕士学位期间的成果 | 第68-69页 |
参考文献 | 第69-71页 |