首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

股票系统之热门话题发现子系统的设计与实现

摘要第4-5页
Abstract第5页
第1章 绪论第9-17页
    1.1 课题背景第9页
        1.1.1 课题来源及项目名称第9页
        1.1.2 课题研究的目的与意义第9页
    1.2 本课题相关的国内外研究状况第9-15页
        1.2.1 网络爬虫第10页
        1.2.2 网页抽取第10-12页
        1.2.3 文档过滤第12页
        1.2.4 数据去重第12-13页
        1.2.5 聚类分析第13-14页
        1.2.6 话题表示第14-15页
    1.3 本课题研究的主要内容第15-17页
第2章 热门话题发现子系统的需求分析与总体设计第17-26页
    2.1 热门话题发现子系统的需求分析第17-19页
        2.1.1 热门话题发现子系统的业务分析第17页
        2.1.2 热门话题发现子系统的功能性需求第17-19页
        2.1.3 热门话题发现子系统的非功能性需求第19页
    2.2 热门话题发现子系统总体设计第19-25页
        2.2.1 模块划分第19-20页
        2.2.2 总体结构第20-21页
        2.2.3 热门话题发现子系统各模块的总体设计第21-25页
    2.3 本章小结第25-26页
第3章 热门话题发现子系统的详细设计与实现第26-65页
    3.1 网络爬虫模块的设计与实现第26-42页
        3.1.1 配置子模块第27-28页
        3.1.2 Url管理子模块第28-32页
        3.1.3 页面下载子模块第32-34页
        3.1.4 页面处理子模块第34-38页
        3.1.5 数据管道子模块第38-41页
        3.1.6 驱动子模块第41-42页
    3.2 网页抽取模块的设计与实现第42-48页
        3.2.1 网页抽取的特征选取第43页
        3.2.2 网页抽取模块类的设计第43-46页
        3.2.3 网页抽取模块类的实现第46-48页
    3.3 文本过滤模块的设计与实现第48-51页
        3.3.1 文本过滤的特征选取第48-49页
        3.3.2 文本过滤模块类的设计第49-50页
        3.3.3 文本过滤模块类的实现第50-51页
    3.4 数据去重模块的设计与实现第51-56页
        3.4.1 数据去重模块类的设计第52-53页
        3.4.2 数据去重模块类的实现第53-56页
    3.5 话题聚类模块的设计与实现第56-59页
        3.5.1 话题聚类模块类的设计第56-58页
        3.5.2 话题聚类模块类的实现第58-59页
    3.6 话题表示模块的设计与实现第59-62页
        3.6.1 话题表示模块类的设计第60-61页
        3.6.2 话题表示模块类的实现第61-62页
    3.7 关键问题的解决第62-64页
        3.7.1 聚类的效率第62-63页
        3.7.2 聚类的效果第63-64页
    3.8 本章小结第64-65页
第4章 热门话题发现子系统的测试第65-71页
    4.1 测试环境第65-66页
    4.2 功能性测试及结果分析第66-68页
        4.2.1 网络爬虫功能测试第66-67页
        4.2.2 网页抽取功能测试第67页
        4.2.3 文本过滤功能测试第67-68页
        4.2.4 话题聚类功能测试第68页
    4.3 性能测试及结果分析第68-70页
        4.3.1 网络爬虫性能测试第68-69页
        4.3.2 网页抽取性能测试第69页
        4.3.3 数据去重性能测试第69-70页
        4.3.4 话题聚类性能测试第70页
    4.4 本章小结第70-71页
结论第71-72页
参考文献第72-77页
致谢第77-78页
个人简历第78页

论文共78页,点击 下载论文
上一篇:人体运动判别特征提取及分类方法研究
下一篇:基于第四方平台的现代文化演出服务建模与组合优化技术