首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

农产品价格主题搜索引擎的研究与实现

摘要第8-9页
英文摘要第9-10页
1 前言第11-18页
    1.1 主题搜索引擎简介第11-13页
        1.1.1 主题搜索引擎与通用搜索引擎的异同第11-12页
        1.1.2 主题搜索引擎的结构第12-13页
    1.2 国内外研究现状第13-15页
        1.2.1 国外研究概况第13-14页
        1.2.2 国内研究概况第14-15页
    1.3 本文研究目标第15-17页
    1.4 本文组织结构第17-18页
2 农产品价格主题搜索引擎系统架构第18-23页
    2.1 数据搜集系统第19-21页
    2.2 数据索引系统第21-22页
    2.3 用户服务系统第22页
    2.4 本章小结第22-23页
3 关键技术与算法研究第23-43页
    3.1 抓取策略第23-26页
        3.1.1 广度优先策略第23页
        3.1.2 深度优先策略第23-24页
        3.1.3 最好优先策略第24页
        3.1.4 抓取策略改进第24-26页
    3.2 网页去重算法第26-28页
        3.2.1 Shingling算法第26-27页
        3.2.2 I-Match算法第27页
        3.2.3 TF-IDF算法第27-28页
    3.3 网页处理第28-32页
        3.3.1 编码转换第28页
        3.3.2 信息提取第28-30页
        3.3.3 中文分词第30-32页
    3.4 网页更新策略第32-34页
        3.4.1 用户体验策略第33页
        3.4.2 历史参考策略第33页
        3.4.3 聚类抽样策略第33-34页
    3.5 分类器算法第34-37页
        3.5.1 KNN算法第34-36页
        3.5.2 SVM算法第36-37页
    3.6 Solr索引第37-38页
    3.7 页面排序算法第38-39页
        3.7.1 Page Rank算法第38页
        3.7.2 HITS算法第38-39页
    3.8 缓存第39-42页
        3.8.1 缓存对象第39-40页
        3.8.2 缓存结构第40-41页
        3.8.3 缓存清理策略第41-42页
        3.8.4 缓存更新策略第42页
    3.9 本章小结第42-43页
4 系统实现第43-49页
    4.1 分布式部署网络爬虫第43-44页
    4.2 主题词库搭建第44-45页
    4.3 数据索引系统实现第45-46页
        4.3.1 Solr中文支持配置第45页
        4.3.2 分布式索引第45-46页
    4.4 分类器改进第46-47页
    4.5 缓存系统架构第47-48页
    4.6 本章小结第48-49页
5 实验分析第49-56页
    5.1 实验环境第49-50页
    5.2 抓取性能测试第50-54页
    5.3 检索功能测试第54-55页
    5.4 本章小结第55-56页
6 总结与展望第56-58页
    6.1 研究工作总结第56页
    6.2 展望第56-58页
致谢第58-59页
参考文献第59-64页
攻读硕士学位期间发表的学术论文第64页

论文共64页,点击 下载论文
上一篇:黄瓜果实苦味遗传分析与分子标记研究
下一篇:清远市臻味稻农业开发有限公司发展战略研究