基于主题的新闻搜索引擎的研究与实现
| 摘要 | 第1-7页 |
| Abstract | 第7-9页 |
| 1 绪论 | 第9-20页 |
| ·搜索引擎概述 | 第9-12页 |
| ·搜索引擎的工作原理 | 第9-11页 |
| ·搜索引擎的基本组成 | 第11-12页 |
| ·搜索引擎的研究重点 | 第12页 |
| ·新闻搜索引擎概述 | 第12-19页 |
| ·新闻搜索引擎的发展背景 | 第13-14页 |
| ·国内外研究现状 | 第14-18页 |
| ·论文研究的意义 | 第18-19页 |
| ·本论文主要工作和全文组织 | 第19-20页 |
| 2 新闻搜索引擎的相关关键技术 | 第20-39页 |
| ·自然语言处理 | 第20-24页 |
| ·自然语言处理简介 | 第20-21页 |
| ·N-gram 语言模型 | 第21-22页 |
| ·平滑技术 | 第22-24页 |
| ·文本分类 | 第24-29页 |
| ·评估方法 | 第25页 |
| ·关键技术 | 第25-29页 |
| ·文本的表示 | 第25-26页 |
| ·特征项的抽取 | 第26-27页 |
| ·训练方法与分类方法 | 第27-29页 |
| ·用户兴趣挖掘 | 第29-33页 |
| ·实现方法 | 第30-31页 |
| ·系统文件 | 第31页 |
| ·个人与群体兴趣挖掘 | 第31-32页 |
| ·查询扩展 | 第32-33页 |
| ·智能代理技术 | 第33-35页 |
| ·智能代理简介 | 第33-34页 |
| ·信息代理 | 第34-35页 |
| ·信息推送技术 | 第35-39页 |
| ·信息推送技术简介 | 第35-36页 |
| ·“推送”的优缺点 | 第36-37页 |
| ·推送技术的分类 | 第37页 |
| ·“推送”的应用及发展方向 | 第37-39页 |
| 3 新闻搜索引擎的设计 | 第39-59页 |
| ·搜索引擎的功能组成 | 第39-40页 |
| ·本系统的主要功能 | 第40-51页 |
| ·新闻网页的获取 | 第40-41页 |
| ·新闻信息抽取 | 第41-46页 |
| ·Web 文档的结构特点 | 第41-42页 |
| ·如何抽取信息 | 第42-44页 |
| ·权重计算 | 第44-46页 |
| ·信息标引的存储 | 第46页 |
| ·文档分类 | 第46页 |
| ·用户兴趣主题 | 第46-51页 |
| ·词的共现概率研究 | 第47-49页 |
| ·共现短语的抽取 | 第49-51页 |
| ·新闻推送 | 第51页 |
| ·自动文本分类 | 第51-54页 |
| ·问题描述 | 第52-53页 |
| ·数据稀疏问题及其解决方法 | 第53页 |
| ·结合语言模型的分类算法 | 第53-54页 |
| ·基于用户兴趣主题的查询扩展 | 第54-59页 |
| ·问题描述 | 第54-55页 |
| ·相关性与用户建模 | 第55-56页 |
| ·用户兴趣建模 | 第56-58页 |
| ·面向用户的查询扩展 | 第58-59页 |
| 4 新闻搜索引擎的实现 | 第59-64页 |
| ·系统运行环境 | 第59页 |
| ·搜索引擎的评价标准 | 第59-61页 |
| ·分类算法实验结果 | 第61页 |
| ·基于用户兴趣主题的查询扩展实验 | 第61-63页 |
| ·系统评测 | 第63-64页 |
| 5 总结和展望 | 第64-65页 |
| 参考文献 | 第65-70页 |
| 攻读硕士生期间发表的论文 | 第70-71页 |
| 致谢 | 第71页 |