首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

基于Web Community识别的专业搜索引擎研究

摘要第1-4页
ABSTRACT第4-8页
第一章 绪论第8-18页
   ·背景第8页
   ·通用搜索引擎技术第8-10页
   ·元搜索引擎第10-12页
   ·专业搜索引擎技术第12-15页
     ·通用搜索引擎的弊端第12-13页
     ·专业搜索引擎优势第13页
     ·Web Community第13-15页
   ·网络蜘蛛第15-16页
   ·搜索引擎发展趋势第16-17页
   ·本文的工作和组织第17-18页
第二章 WEB COMMUNITY识别研究及其发展现状第18-29页
   ·专业网络蜘蛛第18-19页
   ·基于网页内容的主题判别第19-21页
     ·布尔模型第20页
     ·向量空间模型第20-21页
   ·基于链接的页面分析算法第21-25页
     ·PageRank超链分析算法第22-23页
     ·HITS算法第23-24页
     ·Maximum Flow Communities第24-25页
     ·页面集合紧密度第25页
   ·WEB COMMUNITY的SCALE-FREE特性第25-28页
     ·Random Network第25-26页
     ·Scale-free特性第26-27页
     ·Scale-free现象的成因第27-28页
     ·Scale-free对Community识别的价值第28页
   ·本章小结第28-29页
第三章 专业网络蜘蛛的设计与实现第29-39页
   ·“种子集”设定第29-30页
   ·专业网络蜘蛛结构及实现第30-33页
     ·URL管理器第30-31页
     ·URL提取器第31-32页
     ·页面信息获取器第32-33页
     ·索引数据库第33页
   ·网络蜘蛛性能优化第33-36页
     ·网络蜘蛛内部并行性第33-36页
     ·网络蜘蛛外部并行性第36页
   ·网络蜘蛛测试第36-38页
     ·页面抓取速度测试第36-37页
     ·链接识别率测试第37-38页
   ·本章小结第38-39页
第四章 WEB COMMUNITY识别关键算法研究第39-45页
   ·关键字集第39-40页
   ·关键字权重分配第40-41页
     ·关键字权重影响因子第40-41页
     ·关键字权重的计算第41页
   ·基于内容的主题判别第41-43页
     ·页面专业相关度计算第41-42页
     ·关键词集和页面间的α-距离第42-43页
   ·页面结构分析第43页
   ·收敛性判断第43-44页
   ·本章小结第44-45页
第五章 系统设计实现及测试第45-54页
   ·系统设计目标第45页
   ·系统架构第45-47页
     ·专业网络蜘蛛第46页
     ·页面逻辑处理模块第46-47页
     ·Web Community构建模块第47页
   ·系统实现描述第47-50页
   ·系统测试分析第50-54页
     ·分析过程第50-51页
     ·相关统计数据第51页
     ·数据特征分析第51-52页
     ·Web Community收敛性分析第52页
     ·系统运行结果对比第52-54页
第六章 总结与展望第54-56页
   ·总结第54页
   ·展望第54-56页
参考文献第56-58页
致谢第58页

论文共58页,点击 下载论文
上一篇:基于供应链管理的备件管理研究
下一篇:基于CT实时观测的沥青混合料裂纹扩展行为研究