首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

针对互联网公共服务的搜索引擎关键技术研究

摘要第5-6页
ABSTRACT第6页
第一章 引言第9-14页
    1.1 研究背景第9页
    1.2 互联网公共服务研究现状第9-12页
        1.2.1 互联网Web Service第9-10页
        1.2.2 语义Web第10页
        1.2.3 文本分析第10-11页
        1.2.4 百度apistore第11页
        1.2.5 apis.io第11页
        1.2.6 小结第11-12页
    1.3 本文工作概述第12页
        1.3.1 研究目标与内容第12页
        1.3.2 技术方案与关键技术概述第12页
        1.3.3 研究成果第12页
    1.4 本文组织结构第12-14页
第二章 相关理论与关键技术第14-23页
    2.1 互联网公共服务描述文档第14-15页
    2.2 中文分词方法第15-16页
        2.2.1 最大正向匹配法和最大逆向匹配法第15页
        2.2.2 正向迭代最细粒度切分算法第15页
        2.2.3 ICTCLAS第15-16页
    2.3 文本特征提取第16-17页
        2.3.1 词频-逆文档频率(TF-IDF)第16-17页
        2.3.2 互信息法第17页
    2.4 文档分类方法第17-19页
        2.4.1 支持向量机(SVM)第17-19页
        2.4.2 朴素贝叶斯第19页
        2.4.3 k近邻第19页
    2.5 网页索引技术第19-21页
        2.5.1 倒排索引第20页
        2.5.2 词-文档矩阵第20-21页
    2.6 字典索引结构第21页
        2.6.1 B+树第21页
        2.6.2 Log-Structure Merge树(LSM树)第21页
    2.7 搜索引擎评价指标第21-22页
    2.8 本章小结第22-23页
第三章 互联网公共服务搜索引擎的关键技术实现第23-33页
    3.1 互联网公共服务发现网络爬虫第23-27页
        3.1.1 基于浏览器内核的网络爬虫第23-24页
        3.1.2 互联网公共服务描述文档预处理算法第24-25页
        3.1.3 互联网公共服务描述文档分类器的训练第25-27页
    3.2 互联网公共服务描述文档索引第27-30页
        3.2.1 词-文档矩阵的压缩与转置第27-29页
        3.2.2 互联网公共服务描述文档索引生成与维护第29-30页
    3.3 用户搜索请求处理第30-32页
    3.4 本章小结第32-33页
第四章 APISE架构设计与实现第33-36页
    4.1 APISE架构设计第33-34页
    4.2 APISE系统组件实现第34-35页
        4.2.1 数据存储组件第34页
        4.2.2 互联网公共服务发现网络爬虫第34页
        4.2.3 互联网公共服务描述文档索引组件第34页
        4.2.4 用户搜索请求处理组件第34-35页
        4.2.5 用户界面第35页
    4.3 本章小结第35-36页
第五章 APISE和关键技术评价第36-44页
    5.1 实验运行环境第36页
    5.2 简单网络爬虫与基于浏览器内核的网络爬虫性能对比第36-37页
    5.3 互联网公共服务描述文档分类器训练与验证第37-40页
        5.3.1 训练样本集的获取第37-38页
        5.3.2 分类器的训练与验证第38-39页
        5.3.3 小结第39-40页
    5.4 APISE检索效果评价第40-43页
    5.5 本章小结第43-44页
第六章 总结与展望第44-46页
    6.1 论文主要工作总结第44页
    6.2 后续工作展望第44-46页
致谢第46-47页
参考文献第47-49页
附录一 互联网公共服务文档示例第49-53页
附录二 攻读硕士学位期间发表论文情况第53页

论文共53页,点击 下载论文
上一篇:超精密绝对光栅尺结构设计及其静态读码误差分析
下一篇:基于双孔介质模型的煤层气富集区地震预测技术研究