首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--软件工程论文

科技资讯聚合分析系统的研究与实现

摘要第4-6页
ABSTRACT第6-7页
第一章 绪论第10-15页
    1.1 研究背景及意义第10-11页
    1.2 国内外研究现状第11-14页
        1.2.1 信息聚合技术第11-12页
        1.2.2 信息分析技术第12-14页
    1.3 本文工作及主要研究成果第14-15页
第二章 相关技术与理论研究第15-26页
    2.1 信息聚合技术第15-19页
        2.1.1 RSS技术第15-16页
        2.1.2 爬虫技术第16-19页
    2.2 中文分词技术第19-23页
        2.2.1 隐马尔可夫模型第20-21页
        2.2.2 最大熵模型第21页
        2.2.3 条件随机场模型第21-23页
    2.3 随机森林算法第23-25页
        2.3.1 决策树第23-24页
        2.3.2 Bootstrap算法第24-25页
    2.4 TF-IDF算法第25页
    2.5 本章小结第25-26页
第三章 科技资讯聚合分析关键技术和算法的研究第26-36页
    3.1 中文实体链接预处理第26-30页
        3.1.1 测试数据集第27页
        3.1.2 测试环境第27页
        3.1.3 测试方法第27页
        3.1.4 计算标准第27-28页
        3.1.5 测试1第28页
        3.1.6 测试2第28-29页
        3.1.7 测试3第29页
        3.1.8 结论第29-30页
    3.2 科技资讯实体链接结果剪枝算法第30-35页
        3.2.1 随机森林算法和TF-IDF的结合第31-32页
        3.2.2 剪枝随机森林算法的实现第32-33页
        3.2.3 TF-IDF的实现过程第33-34页
        3.2.4 实验准备第34页
        3.2.5 实验结果第34-35页
    3.3 本章小结第35-36页
第四章 科技资讯聚合分析系统的设计与实现第36-55页
    4.1 科技资讯聚合分析系统的设计第36-41页
        4.1.1 信息采集模块的设计第37-38页
        4.1.2 实体链接模块的设计第38-39页
        4.1.3 系统管理模块的设计第39-40页
        4.1.4 信息服务模块的设计第40-41页
    4.2 科技资讯聚合系统的实现第41-46页
        4.2.1 爬虫采集任务第41-45页
        4.2.2 RSS信息提取任务第45-46页
    4.3 实体链接系统的实现第46-53页
        4.3.1 实体指称识别第48-50页
        4.3.2 语义消歧第50-51页
        4.3.3 实体链接结果剪枝第51-53页
    4.4 本章小结第53-55页
第五章 系统测试和性能评估第55-64页
    5.1 测试环境第55-56页
    5.2 功能测试第56-61页
        5.2.1 采集功能测试第56-58页
        5.2.2 实体链接功能测试第58-60页
        5.2.3 系统管理功能和用户信息功能测试第60-61页
    5.3 性能测试第61-63页
        5.3.1 速度测试第62页
        5.3.2 资源消耗测试第62-63页
    5.4 本章小结第63-64页
第六章 总结与展望第64-66页
参考文献第66-69页
作者攻读硕士学位期间发表的学术论文目录第69页

论文共69页,点击 下载论文
上一篇:基于Hadoop的新闻事件融合分析算法的研究与实现
下一篇:SDN中路由协议通用传输模块的研究与实现