首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于关键特征聚类的Top N热点话题检测方法研究

摘要第5-6页
Abstract第6页
第1章 绪论第9-16页
    1.1 研究背景第9-10页
    1.2 研究内容的提出第10-11页
    1.3 研究意义第11-12页
    1.4 论文的主要研究工作第12-13页
    1.5 论文的组织形式第13-16页
第2章 相关工作综述第16-28页
    2.1 话题检测与追踪第16-20页
        2.1.1 话题定义第17-18页
        2.1.2 新事件检测(NED)第18-19页
        2.1.3 在线话题检测(OTD)第19页
        2.1.4 层次话题检测(HTD)第19-20页
        2.1.5 事件回顾检测(RED)第20页
    2.2 关键词抽取第20-24页
        2.2.1 候选词选取第21页
        2.2.2 推荐关键词第21-22页
        2.2.3 TF-IDF算法第22页
        2.2.4 隐含狄利克雷分配(LDA)模型第22-24页
    2.3 命名实体识别第24-27页
        2.3.1 基于规则和字典的方法第25页
        2.3.2 基于统计的方法第25-26页
        2.3.3 混合方法第26-27页
    2.4 本章小结第27-28页
第3章 单文档关键特征自动抽取算法第28-37页
    3.1 研究概述第28-29页
    3.2 关键特征抽取预处理第29-30页
        3.2.1 中文分词第29页
        3.2.2 词性标注第29-30页
        3.2.3 选取候选词第30页
    3.3 文档关键特征抽取第30-36页
        3.3.1 基于TF-IDF的关键特征抽取算法第30-31页
        3.3.2 基于LDA的关键特征抽取算法第31-32页
        3.3.3 基于TextRank关键特征抽取算法第32-34页
        3.3.4 基于等价路径替换的关键特征抽取算法第34-36页
    3.4 本章小结第36-37页
第4章 Top N热点话题检测方法第37-51页
    4.1 研究概述第37-38页
    4.2 基于文档关键特征的子话题聚类第38-42页
        4.2.1 话题定义第38-39页
        4.2.2 话题空间第39-41页
        4.2.3 子话题聚类第41-42页
    4.3 子话题关键特征抽取第42-48页
        4.3.1 前向匹配算法第43-46页
        4.3.2 后向匹配算法第46-47页
        4.3.3 双向匹配算法第47-48页
    4.4 Top N热点话题获取第48-49页
        4.4.1 错误话题消除第48-49页
        4.4.2 相似子话题归并第49页
    4.5 本章小结第49-51页
第5章 实验系统原型设计与结果分析第51-59页
    5.1 实验环境第51页
    5.2 实验系统原型设计第51-52页
    5.3 实验结果分析第52-58页
        5.3.1 文档关键特征抽取算法第53-55页
        5.3.2 文档关键特征参数M第55-56页
        5.3.3 本文算法与传统话题检测的对比第56-58页
    5.4 本章小结第58-59页
第6章 结论第59-62页
    6.1 总结第59-60页
    6.2 创新点第60-61页
    6.3 展望第61-62页
参考文献第62-67页
攻读学位期间发表的论文与研究成果清单第67-68页
致谢第68页

论文共68页,点击 下载论文
上一篇:逆向工程及CAM技术在工艺品开发中的研究与应用
下一篇:基于协同过滤的学习资源个性化推荐研究