基于个性化搜索的网页特征提取相关技术的研究
| 摘要 | 第1-7页 |
| Abstract | 第7-13页 |
| 1 绪论 | 第13-18页 |
| ·个性化服务简介 | 第13-14页 |
| ·选题背景及研究意义 | 第14-16页 |
| ·论文组织结构 | 第16-17页 |
| ·本章小结 | 第17-18页 |
| 2 相关知识介绍 | 第18-29页 |
| ·网络蜘蛛 | 第18-20页 |
| ·网页正文提取方法 | 第20-24页 |
| ·网页正文分词方法 | 第24-25页 |
| ·网页特征描述现状 | 第25-27页 |
| ·本章小结 | 第27-29页 |
| 3 基于HTML元素的网页正文提取算法改进 | 第29-38页 |
| ·基于HTML元素的网页正文提取算法 | 第29-34页 |
| ·基于超链接的网页正文提取算法 | 第34-37页 |
| ·本章小结 | 第37-38页 |
| 4 基于兴趣词典的网页分词方法 | 第38-45页 |
| ·兴趣词典 | 第38-41页 |
| ·基于兴趣词典的网页分词方法设计 | 第41-43页 |
| ·兴趣词典的更新 | 第43-44页 |
| ·本章小结 | 第44-45页 |
| 5 网页特征词的权重计算算法改进 | 第45-54页 |
| ·传统的词语权重计算 | 第45-47页 |
| ·基于HTML标记的TF-IDF改进计算方法 | 第47-50页 |
| ·网页特征描述生成 | 第50-53页 |
| ·本章小结 | 第53-54页 |
| 6 基于个性化搜索引擎插件的测试 | 第54-65页 |
| ·个性化搜索引擎MyPSE | 第54-56页 |
| ·测试系统平台的构建及测试方案 | 第56-59页 |
| ·基于超链接的网页正文提取算法测试 | 第59-61页 |
| ·兴趣词典准确性和有效性测试 | 第61-62页 |
| ·网页特征词权重计算对比测试 | 第62-64页 |
| ·本章小结 | 第64-65页 |
| 7 总结与展望 | 第65-67页 |
| ·研究总结 | 第65页 |
| ·研究展望 | 第65-67页 |
| 致谢 | 第67-68页 |
| 攻读硕士学位期间的成果 | 第68-69页 |
| 参考文献 | 第69-71页 |