首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

校园搜索引擎开发及其流量测量

摘要第4-5页
ABSTRACT第5-6页
第一章 绪论第9-12页
    1.1 研究背景与意义第9-10页
    1.2 研究内容与目标第10-11页
    1.3 论文结构第11-12页
第二章 相关技术研究和分析第12-24页
    2.1 搜索引擎技术研究第12-14页
        2.1.1 搜索引擎的原理和架构第12页
        2.1.2 中文分词第12-13页
        2.1.3 网页评分和排序第13-14页
    2.3 Lucene研究第14-17页
        2.3.1 Lucene的索引结构第15-17页
        2.3.2 Lucene的检索结构第17页
    2.4 Nutch研究第17-19页
        2.4.1 爬虫的工作策略第17-18页
        2.4.2 爬虫的工作流程第18-19页
    2.5 Hadoop技术简析第19-22页
        2.5.1 Hadoop平台的MapReduce模型第19-21页
        2.5.2 HDFS第21-22页
    2.6 流量测量技术研究第22-23页
    2.7 本章小结第23-24页
第三章 校园搜索引擎的设计与实现第24-56页
    3.1 系统需求及可行性分析第24-25页
    3.2 系统总体设计第25-27页
    3.3 爬虫模块设计与实现第27-31页
        3.3.1 爬虫模块总体流程第27-28页
        3.3.2 网页过滤及更新算法设计与实现第28-30页
        3.3.3 网页数据集更新策略第30-31页
    3.4 索引模块设计与实现第31-41页
        3.4.1 索引模块流程第31-33页
        3.4.2 向引擎中添加Paoding中文分词第33-36页
        3.4.3 索引阶段评分因子及评分算法第36-39页
        3.4.4 基于URL结构的评分及去重算法设计与实现第39-41页
    3.5 检索模块设计与实现第41-48页
        3.5.1 检索流程第41-42页
        3.5.2 检索阶段网页总体评分算法第42-43页
        3.5.3 网页完全包含排序算法设计与实现第43-46页
        3.5.4 基于title域字符数排序算法设计与实现第46-48页
    3.6 分布式部署与前端服务器配置第48-50页
    3.7 引擎运行结果第50-55页
    3.8 本章小结第55-56页
第四章 基于搜索业务的Hadoop数据中心流量特性测量第56-65页
    4.1 测量方法设计与实现第57-58页
    4.2 Hadoop数据中心流量特性第58-62页
        4.2.1 流分布特性第58-60页
        4.2.2 数据中心里的大流和小流第60-62页
    4.3 搜索引擎业务流量特性第62-64页
    4.4 本章小结第64-65页
第五章 总结与展望第65-67页
    5.1 工作总结第65-66页
    5.2 工作展望第66-67页
参考文献第67-69页
致谢第69-70页
攻读学位期间发表的学术论文和科研情况第70页

论文共70页,点击 下载论文
上一篇:钢轨扣件松脱检测信号的HHT分析方法
下一篇:一种适用于P2P-VoD业务的分布式存储系统