首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于开放链接模式的网站分类技术研究

摘要第4-5页
Abstract第5页
第一章 绪论第10-13页
    1.1 研究背景与意义第10-11页
    1.2 相关研究现状第11-12页
    1.3 研究内容第12页
    1.4 本文结构安排第12-13页
第二章 背景知识第13-20页
    2.1 网页分类第13-15页
        2.1.1 网页分类特征第13-15页
        2.1.2 网页分类算法综述第15页
    2.2 网站分类第15-16页
    2.3 开放链接数据第16-18页
    2.4 开放链接模式第18-19页
    2.5 导航站点第19-20页
第三章 基于开放链接模式的网站分类第20-29页
    3.1 问题定义第20-21页
        3.1.1 基于开放链接模式的分类体系第20页
        3.1.2 分类算法输入输出第20-21页
    3.2 站点去重之Simhash算法第21-23页
        3.2.1 Simhash算法介绍第21-22页
        3.2.2 Simhash算法用于站点去重第22-23页
    3.3 网站分类算法描述第23-27页
        3.3.1 获取网站内容第23-25页
        3.3.2 获取分类特征第25-26页
        3.3.3 综合站点内容和分类特征计算第26-27页
    3.4 网站分类应用——网站推荐第27-29页
        3.4.1 网站推荐介绍第27-28页
        3.4.2 网站推荐算法第28-29页
第四章 实验与评估第29-40页
    4.1 实验流程第29页
    4.2 实验数据准备第29-34页
        4.2.1 导航站点爬取第29-31页
        4.2.2 分类特征获取第31-33页
        4.2.3 站点内容爬取第33-34页
    4.3 站点分类对比实验第34-37页
        4.3.1 站点特征范围选择第34-35页
        4.3.2 网站标签内容权值选择第35-37页
    4.4 对比实验第37页
    4.5 基于开放链接模式的站点推荐实验第37-40页
第五章 基于站点分类的导航站点设计第40-43页
    5.1 导航站点设计思路第40页
    5.2 导航站点设计结果第40-43页
        5.2.1 站点首页设计第40-41页
        5.2.2 导航网站功能第41-43页
第六章 总结与展望第43-44页
    6.1 工作总结第43页
    6.2 未来展望第43-44页
致谢第44-45页
参考文献第45-49页
攻读硕士学位期间科研成果第49页

论文共49页,点击 下载论文
上一篇:亚热带木荷生长过程及其年轮气候学研究
下一篇:林业政府性支出对林业经济增长的影响研究