首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于多类别文本的新闻热点发现系统设计与实现

摘要第5-6页
ABSTRACT第6页
第一章 绪论第9-13页
    1.1 研究背景与意义第9页
    1.2 国内外研究现状第9-10页
    1.3 论文主要内容第10-11页
    1.4 论文组织结构第11-13页
第二章 新闻热点发现相关技术第13-20页
    2.1 新闻热点的相关概念第13-14页
        2.1.1 新闻特点第13页
        2.1.2 热点话题发现技术的基本概念第13-14页
    2.2 话题检测模型第14-15页
        2.2.1 布尔模型第14页
        2.2.2 向量空间模型第14-15页
        2.2.3 主题模型第15页
        2.2.4 神经网络模型第15页
    2.3 词法分析技术第15-17页
        2.3.1 中文分词技术第15-16页
        2.3.2 词性标注技术第16页
        2.3.3 命名实体识别技术第16页
        2.3.4 词法分析的工具第16-17页
    2.4 特征区分度算法第17-18页
        2.4.1 卡方统计量法(Chi-square)第17页
        2.4.2 信息增益(Information Gain)第17-18页
    2.5 文本聚类算法技术第18-19页
        2.5.1 基于划分的聚类算法第18页
        2.5.2 基于层次的聚类算法第18-19页
        2.5.3 基于密度的聚类算法第19页
    2.6 本章小结第19-20页
第三章 新闻采集、预处理及特征表示方法研究第20-28页
    3.1 新闻信息的采集第20-21页
        3.1.1 新闻网页的特征第20页
        3.1.2 网络爬虫的框架第20页
        3.1.3 新闻内容提取方式第20-21页
    3.2 新闻预处理第21-23页
        3.2.1 新闻噪音过滤第21-22页
        3.2.2 新闻词法分析第22-23页
        3.2.3 新闻停用词的过滤第23页
    3.3 新闻文本特征表示第23-27页
        3.3.1 传统的TF-IDF权重计算方法第24页
        3.3.2 基于新闻特点改进的TF-IDF技术第24-27页
    3.4 本章小结第27-28页
第四章 新闻话题检测与热点发现算法研究第28-42页
    4.1 新闻话题检测算法第28-33页
        4.1.1 基于近邻传播(Affinity Propagation,AP)聚类算法研究第28-31页
        4.1.2 相似度衡量方法的研究第31-32页
        4.1.3 基于相似度计算方式改进的AP聚类算法(APS)第32-33页
    4.2 话题簇识别第33-34页
    4.3 新闻热点发现算法研究第34-35页
    4.4 实验评估第35-41页
        4.4.1 实验语料选择第35页
        4.4.2 评价指标第35-37页
        4.4.3 实验设计与分析第37-41页
    4.5 本章小结第41-42页
第五章 新闻热点发现系统的设计与实现第42-57页
    5.1 系统的总体设计第42-44页
        5.1.1 系统开发环境第42页
        5.1.2 系统流程设计第42页
        5.1.3 系统框架设计第42-44页
        5.1.4 系统的功能模块设计第44页
    5.2 系统的实现第44-56页
        5.2.1 数据采集模块的实现第44-48页
        5.2.2 数据预处理模块的实现第48-50页
        5.2.3 新闻特征向量化模块的实现第50-52页
        5.2.4 新闻热点发现模块的实现第52-56页
    5.3 本章小结第56-57页
第六章 系统的性能评估及功能测试第57-61页
    6.1 评估测试环境第57页
    6.2 性能评估第57-59页
    6.3 功能测试第59-60页
    6.4 本章小结第60-61页
第七章 总结与展望第61-63页
    7.1 本文工作总结第61页
    7.2 未来研究展望第61-63页
致谢第63-64页
参考文献第64-66页

论文共66页,点击 下载论文
上一篇:基于智能手机的脉搏信号检测与监护系统
下一篇:自供电开关控制器的设计与研究