首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于XML和SVM的Web文本挖掘系统研究

摘要第5-6页
ABSTRACT第6页
第一章 绪论第9-14页
    1.1 研究背景第9-10页
    1.2 国内外现状及发展趋势第10-12页
        1.2.1 Web挖掘技术现状第10-12页
        1.2.2 Zoot数据分析方法现状第12页
    1.3 论文研究思路及主要工作第12-14页
第二章 相关技术基础第14-21页
    2.1 文本挖掘概述第14-17页
        2.1.1 Web文本总结第14页
        2.1.2 Web文本分类第14-15页
        2.1.3 Web文本聚类第15-17页
    2.2 XML技术第17-19页
    2.3 支持向量机第19-21页
第三章 WEB文本分类与聚类方法的比较第21-25页
    3.1 WEB文本分类方法比较第21-22页
    3.2 WEB文本聚类方法第22-25页
第四章 基于XML和SVM的WEB文本挖掘模型的构建第25-29页
    4.1 文本挖掘的流程及难点第25-26页
        4.1.1 Web文本挖掘的流程第25页
        4.1.2 Web文本挖掘的难点第25-26页
    4.2 基于XML和SVM的WEB文本挖掘模型的总体结构第26-29页
        4.2.1 模型的逻辑层次第26-27页
        4.2.2 模型的总体结构第27-28页
        4.2.3 模型的优点第28-29页
第五章 WEB文本预处理第29-41页
    5.1 文本抽取第29-33页
        5.1.1 权威页面的确定第29-30页
        5.1.2 抽取XML文档第30-33页
    5.2 WEB文本处理第33-36页
    5.3 特征抽取和WEB文本表示第36-41页
        5.3.1 特征抽取方法比较第36-38页
        5.3.2 基于主成分分析的特征抽取第38-39页
        5.3.3 Web文本表示第39-41页
第六章 系统实现及性能优化第41-58页
    6.1 基于SVM的WEB文本分类实现第41-44页
    6.2 WEB文本聚类实现第44-46页
    6.3 ZOOT系统实现第46-49页
        6.3.1 Zoot性能优化第47页
        6.3.2 join第47-48页
        6.3.3 mapjoin第48-49页
    6.4 HIVE优化第49-53页
        6.4.1 控制hive任务中的map数第49-51页
        6.4.2 控制hive任务的reduce数第51-53页
    6.5 性能对比分析第53-58页
第七章 总结与展望第58-60页
    7.1 总结第58页
    7.2 展望第58-60页
致谢第60-61页
参考文献第61-64页
攻硕期间取得的研究成果第64-65页

论文共65页,点击 下载论文
上一篇:基于SSH的银行分析型客户关系管理系统设计与实现
下一篇:拉萨机场大面积航班延误协调联动系统的设计与实现