首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

现代维吾尔语信息检索与管理平台

摘要第5-7页
ABSTRACT第7-8页
第1章 绪论第11-17页
    1.1 课题的研究背景和意义第11-12页
    1.2 国内外研究现状第12-15页
    1.3 论文的主要研究内容和组织结构第15-17页
第2章 系统总体方案设计第17-28页
    2.1 系统设计目标第17页
    2.2 系统功能列表第17-18页
        2.2.1 搜索引擎用户搜索界面第17页
        2.2.2 搜索引擎后台管理界面第17-18页
    2.3 系统组成结构第18-19页
    2.4 系统数据流图第19-22页
        2.4.1 爬取网页建立索引的数据流第19-20页
        2.4.2 搜索页面提交搜索关键词搜索的数据流第20页
        2.4.3 点击搜索结果页面数据流第20-22页
    2.5 系统的高并发高可用架构设计第22-27页
        2.5.1 系统软件架构第22-23页
        2.5.2 技术方案第23-25页
        2.5.3 基于Mycat实现网页数据的拆分第25-26页
        2.5.4 Redis集群第26-27页
    2.6 本章小结第27-28页
第3章 搜索引擎子系统实现第28-43页
    3.1 基于Hadoop分布式系统的Nutch爬虫第28-32页
        3.1.1 Hadoop分布式框架第28-29页
        3.1.2 Nutch爬虫介绍和环境搭建第29-31页
        3.1.3 网页数据的存储第31-32页
        3.1.4 网页编码分析第32页
    3.2 分词模型与分词标注对外服务发布第32-35页
        3.2.1 维吾尔语分词模型介绍第32-34页
        3.2.2 基于WebService发布分词标记服务第34-35页
    3.3 网页结构内容分析与过滤第35-36页
    3.4 Lucene索引器第36-37页
    3.5 检索器第37-42页
        3.5.1 搜索结果的排序与高亮显示第37-41页
        3.5.2 网页快照第41-42页
    3.6 本章小结第42-43页
第4章 后台管理子系统实现第43-49页
    4.1 Nutch的启动与参数配置第43-44页
    4.2 爬虫运行状态的监控第44-46页
    4.3 分词实验管理第46页
    4.4 用户行为管理第46-48页
    4.5 本章小结第48-49页
第5章 系统测试第49-65页
    5.1 搜索引擎子系统的测试第49-58页
        5.1.1 系统的功能测试第49-56页
        5.1.2 系统的性能测试第56-58页
    5.2 后台管理子系统的测试第58-62页
    5.3 系统测试结果分析第62-64页
    5.4 本章小结第64-65页
第6章 总结与展望第65-67页
    6.1 总结第65-66页
    6.2 展望第66-67页
参考文献第67-69页
致谢第69页

论文共69页,点击 下载论文
上一篇:我国商业银行国际贸易融资风险管理研究--以Z银行为例
下一篇:利率市场化对我国异质性商业银行盈利能力的影响研究