基于Web Community识别的专业搜索引擎研究

摘要	第1-4页
ABSTRACT	第4-8页
第一章绪论	第8-18页
·背景	第8页
·通用搜索引擎技术	第8-10页
·元搜索引擎	第10-12页
·专业搜索引擎技术	第12-15页
·通用搜索引擎的弊端	第12-13页
·专业搜索引擎优势	第13页
·Web Community	第13-15页
·网络蜘蛛	第15-16页
·搜索引擎发展趋势	第16-17页
·本文的工作和组织	第17-18页
第二章 WEB COMMUNITY识别研究及其发展现状	第18-29页
·专业网络蜘蛛	第18-19页
·基于网页内容的主题判别	第19-21页
·布尔模型	第20页
·向量空间模型	第20-21页
·基于链接的页面分析算法	第21-25页
·PageRank超链分析算法	第22-23页
·HITS算法	第23-24页
·Maximum Flow Communities	第24-25页
·页面集合紧密度	第25页
·WEB COMMUNITY的SCALE-FREE特性	第25-28页
·Random Network	第25-26页
·Scale-free特性	第26-27页
·Scale-free现象的成因	第27-28页
·Scale-free对Community识别的价值	第28页
·本章小结	第28-29页
第三章专业网络蜘蛛的设计与实现	第29-39页
·“种子集”设定	第29-30页
·专业网络蜘蛛结构及实现	第30-33页
·URL管理器	第30-31页
·URL提取器	第31-32页
·页面信息获取器	第32-33页
·索引数据库	第33页
·网络蜘蛛性能优化	第33-36页
·网络蜘蛛内部并行性	第33-36页
·网络蜘蛛外部并行性	第36页
·网络蜘蛛测试	第36-38页
·页面抓取速度测试	第36-37页
·链接识别率测试	第37-38页
·本章小结	第38-39页
第四章 WEB COMMUNITY识别关键算法研究	第39-45页
·关键字集	第39-40页
·关键字权重分配	第40-41页
·关键字权重影响因子	第40-41页
·关键字权重的计算	第41页
·基于内容的主题判别	第41-43页
·页面专业相关度计算	第41-42页
·关键词集和页面间的α-距离	第42-43页
·页面结构分析	第43页
·收敛性判断	第43-44页
·本章小结	第44-45页
第五章系统设计实现及测试	第45-54页
·系统设计目标	第45页
·系统架构	第45-47页
·专业网络蜘蛛	第46页
·页面逻辑处理模块	第46-47页
·Web Community构建模块	第47页
·系统实现描述	第47-50页
·系统测试分析	第50-54页
·分析过程	第50-51页
·相关统计数据	第51页
·数据特征分析	第51-52页
·Web Community收敛性分析	第52页
·系统运行结果对比	第52-54页
第六章总结与展望	第54-56页
·总结	第54页
·展望	第54-56页
参考文献	第56-58页
致谢	第58页