基于评论的博客搜索引擎的设计与实现

中文摘要	第3-4页
英文摘要	第4页
1 绪论	第7-11页
1.1 课题背景及意义	第7-9页
1.2 论文的主要工作	第9页
1.3 论文的结构	第9-11页
2 相关技术	第11-22页
2.1 搜索引擎工作原理概述	第11-12页
2.2 搜索引擎的相关技术	第12-14页
2.2.1 网络蜘蛛工作原理	第12-13页
2.2.2 网络蜘蛛搜索策略	第13-14页
2.3 文本分类方法	第14-18页
2.3.1 朴素贝叶斯	第14-15页
2.3.2 支持向量机	第15-18页
2.4 Nutch开源软件	第18-21页
2.4.1 Nutch的组成部分	第18页
2.4.2 Lucene和Nutch的结果排序控制	第18-20页
2.4.3 Nutch的具体工作流程	第20-21页
2.5 本章小结	第21-22页
3 评论文本情感倾向性分析	第22-36页
3.1 文本情感分析的研究现状	第22-23页
3.2 评论文本预处理	第23-28页
3.2.1 分词之前预处理和中文分词	第24-26页
3.2.2 停用词过滤	第26-27页
3.2.3 基于博客评论领域的情感词典的构建	第27-28页
3.3 评论文本分类	第28-33页
3.3.1 文本文档表示模型	第28-29页
3.3.2 特征选择算法	第29-32页
3.3.3 特征选择算法的改进	第32-33页
3.3.4 特征权值计算	第33页
3.4 实验以及结果分析	第33-35页
3.4.1 实验评价标准	第33-34页
3.4.2 实验结果及分析	第34-35页
3.5 本章小结	第35-36页
4 基于评论的博客搜索引擎的设计	第36-48页
4.1 系统的框架设计	第36-37页
4.2 信息资源抓取模块的设计	第37-39页
4.2.1 Ajax页面抓取技术	第37-39页
4.2.2 支持动态页面抓取的爬虫设计	第39页
4.3 信息资源预处理模块的设计	第39-43页
4.3.1 博客评论内容抽取	第39-42页
4.3.2 信息资源预处理模块的设计	第42-43页
4.4 索引建立模块的设计	第43-45页
4.5 检索模块的设计	第45-46页
4.6 检索结果排序设计	第46-47页
4.7 小结	第47-48页
5 基于评论的博客搜索引擎的实现	第48-58页
5.1 信息资源抓取模块实现	第48-49页
5.2 信息资源预处理模块的实现	第49-51页
5.3 索引建立模块的实现	第51-52页
5.4 检索结果排序实现	第52-53页
5.5 系统测试及其结果分析	第53-57页
5.5.1 运行环境以及相关文件配置	第53-54页
5.5.2 系统测试	第54-57页
5.5.3 测试结果分析	第57页
5.6 小结	第57-58页
6 总结与展望	第58-60页
致谢	第60-61页
参考文献	第61-63页