个性化新闻搜索引擎的研究与设计
| 摘要 | 第1-5页 |
| ABSTRACT | 第5-10页 |
| 第一章 绪论 | 第10-18页 |
| ·研究背景及意义 | 第10-11页 |
| ·国内外研究现状 | 第11-14页 |
| ·垂直搜索引擎 | 第14-16页 |
| ·本文的研究内容和结构 | 第16-18页 |
| 第二章 向量空间模型及垂直搜索相关技术研究 | 第18-35页 |
| ·向量空间模型研究 | 第18-19页 |
| ·垂直搜索引擎基本原理 | 第19-23页 |
| ·基本结构 | 第20-21页 |
| ·工作流程 | 第21-23页 |
| ·网页采集和索引技术研究 | 第23-28页 |
| ·网络爬行策略研究 | 第23-25页 |
| ·倒排索引机制 | 第25-26页 |
| ·Lucene 索引及检索框架 | 第26-28页 |
| ·文本分类技术研究 | 第28-34页 |
| ·文本分类及特点 | 第28-29页 |
| ·特征选择函数 | 第29-31页 |
| ·文本分类算法 | 第31-34页 |
| ·本章小结 | 第34-35页 |
| 第三章 个性化垂直搜索引擎关键技术改进与设计 | 第35-55页 |
| ·网络数据采集技术改进与设计 | 第35-40页 |
| ·个性化垂直搜索引擎爬行策略改进 | 第35-38页 |
| ·URL 主题相关过滤规则设计 | 第38-40页 |
| ·文本分类技术改进 | 第40-46页 |
| ·AECE 特征选择函数 | 第40-43页 |
| ·FCKNN 文本分类算法 | 第43-46页 |
| ·用户兴趣模型研究与设计 | 第46-54页 |
| ·RFI 兴趣特征提取 | 第47-50页 |
| ·兴趣描述方式设计 | 第50-51页 |
| ·用户兴趣库的建立及管理 | 第51-53页 |
| ·用户兴趣生成及使用方式 | 第53-54页 |
| ·本章小结 | 第54-55页 |
| 第四章 个性化新闻搜索引擎的设计与实现 | 第55-74页 |
| ·总体结构设计 | 第56-57页 |
| ·爬虫模块设计与实现 | 第57-60页 |
| ·专业爬虫数据流 | 第57-58页 |
| ·新闻页面筛选及内容解析 | 第58-60页 |
| ·辅助爬虫设计 | 第60页 |
| ·索引模块设计与实现 | 第60-64页 |
| ·索引建立流程 | 第60-61页 |
| ·索引结构设计 | 第61-62页 |
| ·索引模块设计类图 | 第62-64页 |
| ·个性化检索模块设计与实现 | 第64-68页 |
| ·检索流程 | 第64-65页 |
| ·检索模块设计类图 | 第65-66页 |
| ·PNSE 检索结果排序策略 | 第66-68页 |
| ·个性化相关模块设计 | 第68-71页 |
| ·RFI 显性反馈方式设计 | 第68页 |
| ·RFI 隐性反馈机制实现 | 第68-70页 |
| ·个性化相关数据库结构设计 | 第70-71页 |
| ·用户界面模块设计 | 第71-73页 |
| ·本章小结 | 第73-74页 |
| 第五章 个性化新闻搜索引擎评测 | 第74-85页 |
| ·专业爬虫测试 | 第74-76页 |
| ·网页采集主题相关性测试 | 第74-75页 |
| ·网页采集时鲜性测试 | 第75-76页 |
| ·文本分类算法测试 | 第76-79页 |
| ·特征选择函数测试 | 第77-78页 |
| ·文本分类算法测试 | 第78-79页 |
| ·个性化检索测试 | 第79-84页 |
| ·用户注册对检索结果的影响 | 第79-80页 |
| ·检索结果的用户相关度测试 | 第80-83页 |
| ·个性化检索性能测试 | 第83-84页 |
| ·本章小结 | 第84-85页 |
| 第六章 总结与展望 | 第85-87页 |
| ·本文工作总结 | 第85-86页 |
| ·工作展望 | 第86-87页 |
| 致谢 | 第87-88页 |
| 参考文献 | 第88-91页 |
| 攻硕期间取得的研究成果 | 第91-92页 |