首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

基于Hadoop和支持向量机的紧密度后处理的研究与实现

致谢第5-6页
摘要第6-7页
ABSTRACT第7页
序言第8-9页
目录第9-11页
1 引言第11-15页
    1.1 选题背景第11-12页
    1.2 研究现状第12-13页
    1.3 主要研究内容第13页
    1.4 论文组织结构第13-14页
    1.5 本章小结第14-15页
2 相关技术第15-24页
    2.1 中文分词第15-17页
        2.1.1 中文分词方法介绍第15页
        2.1.2 中文分词新词发现第15-16页
        2.1.3 中文分词对于搜索引擎的意义第16-17页
    2.2 Hadoop第17-19页
        2.2.1 HDFS第17-18页
        2.2.2 MapReduce第18页
        2.2.3 Hadoop集群介绍第18-19页
    2.3 信息熵第19-20页
    2.4 支持向量机介绍第20-23页
        2.4.1 线性可分的情况第20-22页
        2.4.2 线性不可分的情况第22-23页
    2.5 本章小结第23-24页
3 紧密度算法分析与设计第24-31页
    3.1 紧密度背景第24-27页
    3.2 紧密度离线统计算法设计第27-28页
    3.3 紧密度在线计算算法设计第28-30页
    3.4 本章小结第30-31页
4 紧密度后处理的流程设计与实现第31-51页
    4.1 开发环境第32页
    4.2 现有紧密度策略存在的问题分析第32页
    4.3 基于会话日志的策略的设计第32-39页
        4.3.1 策略简述第32-33页
        4.3.2 数据统计过程与算法第33-35页
        4.3.3 策略实现第35-36页
        4.3.4 策略线下测试结果分析第36-39页
    4.4 基于网页正文的紧密度后处理策略的实现第39-50页
        4.4.1 策略简述第39-40页
        4.4.2 数据预处理第40页
        4.4.3 点互信息提取第40-41页
        4.4.4 Accessor Variety提取第41-43页
        4.4.5 左右熵提取第43页
        4.4.6 策略的建立第43-48页
        4.4.7 模型分类结果分析第48-50页
    4.5 本章小结第50-51页
5 在线策略实现与结果分析第51-59页
    5.1 在线策略的实现第51-54页
        5.1.1 基于会话日志的策略第51-52页
        5.1.2 基于网页正文的策略第52-54页
    5.2 策略的应用效果第54-58页
        5.2.1 基于会话日志的策略应用效果第54-55页
        5.2.2 基于网页正文的策略应用效果第55-56页
        5.2.3 策略上线评比结果分析第56-58页
    5.3 本章小结第58-59页
6 结论第59-61页
参考文献第61-63页
作者简历及攻读硕士/博士学位期间取得的研究成果第63-65页
学位论文数据集第65页

论文共65页,点击 下载论文
上一篇:千米级超高层建筑气动性能研究
下一篇:电动汽车车载充电器设计