首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

Web热点信息发现系统的设计与实现

摘要第5-6页
Abstract第6页
第1章 绪论第12-17页
    1.1 研究背景和意义第12-13页
    1.2 国内外研究现状第13-15页
        1.2.1 话题的检测与跟踪研究现状第13-14页
        1.2.2 关键词自动抽取研究现状第14-15页
    1.3 研究内容与创新点第15-16页
    1.4 论文结构第16-17页
第2章 相关理论和关键技术第17-25页
    2.1 PAT-Tree技术第17-19页
    2.2 网页正文抽取技术第19-20页
    2.3 文本相似度计算方法第20-21页
    2.4 文本聚类第21-24页
        2.4.1 文本聚类概述第21-22页
        2.4.2 常用静态聚类算法第22-24页
        2.4.3 常用动态聚类算法第24页
    2.5 本章小结第24-25页
第3章 Web页面采集与文本预处理第25-35页
    3.1 网络爬虫设计与实现第25-28页
        3.1.1 真实站点目录层次结构抽取第25-27页
        3.1.2 网页分类抓取实现第27-28页
    3.2 网页正文抽取第28-30页
    3.3 文本预处理第30-34页
        3.3.1 中文分词第31页
        3.3.2 停用词处理第31-32页
        3.3.3 特征词抽取及权重处理第32-33页
        3.3.4 稀疏向量压缩矩阵及相似度计算第33-34页
    3.4 本章小结第34-35页
第4章 热点信息发现第35-52页
    4.1 热点信息发现功能划分第35页
    4.2 热点词语发现第35-46页
        4.2.1 热点命名实体抽取第36-39页
        4.2.2 热点非实体串识别第39-46页
    4.3 热点话题发现与跟踪第46-51页
        4.3.1 热点话题定义第46页
        4.3.2 话题检测与跟踪的设计与实现第46-49页
        4.3.3 话题的热度分析第49页
        4.3.4 话题发现与跟踪的类图第49-51页
    4.4 本章小结第51-52页
第5章 热点信息分析及测试第52-64页
    5.1 软件测试方法第52页
    5.2 测试流程第52-53页
    5.3 测试用例第53页
    5.4 热点话题分析与测试结果第53-61页
        5.4.1 话题标题抽取与测试第54-59页
        5.4.2 话题趋势图分析与测试第59-60页
        5.4.3 话题信息岛图分析与测试第60-61页
    5.5 热点词语分析与测试结果第61-63页
        5.5.1 热点词语分析与测试第61-62页
        5.5.2 热点词语趋势与测试第62页
        5.5.3 热点词语频率分析与测试第62-63页
    5.6 本章小结第63-64页
结论第64-66页
参考文献第66-70页
致谢第70页

论文共70页,点击 下载论文
上一篇:《南方周末》外国文化报道研究
下一篇:基于MVC的城市供水管网数字化信息系统设计及实现