摘要 | 第1-5页 |
ABSTRACT | 第5-10页 |
第一章 绪论 | 第10-15页 |
·研究背景 | 第10-11页 |
·课题来源 | 第10页 |
·互联网中的话题 | 第10-11页 |
·国内外研究现状 | 第11-13页 |
·国外研究现状 | 第12页 |
·国内研究现状 | 第12-13页 |
·研究目的与意义 | 第13页 |
·论文结构 | 第13-15页 |
第二章 相关技术 | 第15-25页 |
·互联网话题发现与跟踪 | 第15-17页 |
·互联网话题发现与跟踪系统的特点 | 第16页 |
·互联网话题发现与跟踪任务的难点 | 第16-17页 |
·文本预处理策略 | 第17-20页 |
·中文分词 | 第17-18页 |
·停用词处理 | 第18-19页 |
·文本特征提取 | 第19-20页 |
·话题发现策略 | 第20-21页 |
·单遍聚类 | 第20-21页 |
·凝聚层次聚类 | 第21页 |
·话题跟踪策略 | 第21-22页 |
·Rocchio分类算法 | 第21-22页 |
·K近邻分类算法 | 第22页 |
·话题表现与评估 | 第22-23页 |
·话题表达方法 | 第22-23页 |
·话题评估方法 | 第23页 |
·本章小结 | 第23-25页 |
第三章 基于多级聚类的话题发现算法 | 第25-40页 |
·传统的话题发现算法 | 第25-30页 |
·基于canopy算法的低粒度聚类 | 第26-28页 |
·基于Kmeans的话题发现算法 | 第28-29页 |
·基于单遍聚类Single-Pass的话题发现 | 第29-30页 |
·基于C-KMC多级聚类的话题发现算法C-KMC的提出 | 第30-33页 |
·传统话题发现算法的问题 | 第30-31页 |
·多级聚类算法C-KMC | 第31-33页 |
·C-KMC实验结果与分析 | 第33-38页 |
·数据集 | 第34页 |
·不同相似度度量在C-KMC聚类算法中的实验结果比较 | 第34-36页 |
·C-KMC聚类算法与其他聚类算法的对比 | 第36-37页 |
·采用C-KMC算法的话题发现实验结果 | 第37-38页 |
·本章小结 | 第38-40页 |
第四章 基于特征聚合算法的话题跟踪 | 第40-56页 |
·已有的特征选取策略 | 第40-41页 |
·已有的特征聚合算法和特征簇加权算法 | 第41-42页 |
·基于Chi-square相关度的特征聚合算法C-SRFC的提出 | 第42-48页 |
·特征聚合算法C-SRFC | 第42-45页 |
·特征簇排序和选取策略的提出 | 第45-47页 |
·特征簇频-逆文档频特征加权策略CF-IDF的提出 | 第47-48页 |
·实验结果与分析 | 第48-54页 |
·特征簇选取策略的对比实验 | 第49-50页 |
·特征加权方法的对比实验 | 第50-51页 |
·采用二值分类器组对文本集进行分类实验 | 第51-53页 |
·C-SRFC与其他特征选择方法的比较 | 第53-54页 |
·C-SRFC算法构建的特征空间下的话题跟踪实验 | 第54页 |
·本章小结 | 第54-56页 |
第五章 食品安全话题发现与跟踪系统的实现 | 第56-69页 |
·系统功能与目标 | 第56页 |
·系统分析与设计 | 第56-57页 |
·话题发现任务 | 第57-62页 |
·数据库交互模块 | 第58-59页 |
·爬虫模块 | 第59页 |
·信息抽取模块 | 第59-60页 |
·文本预处理模块 | 第60页 |
·话题检测模块 | 第60-61页 |
·话题评估模块 | 第61页 |
·话题发现模块系统界面 | 第61-62页 |
·话题跟踪任务 | 第62-68页 |
·特征提取模块 | 第62-63页 |
·话题跟踪模块 | 第63页 |
·地图展现模块 | 第63-65页 |
·统计报告模块 | 第65-67页 |
·话题跟踪模块系统界面 | 第67-68页 |
·本章小结 | 第68-69页 |
第六章 论文总结与展望 | 第69-71页 |
·全文总结 | 第69页 |
·下一步工作展望 | 第69-71页 |
参考文献 | 第71-76页 |
致谢 | 第76-77页 |
攻读学位期间研究成果 | 第77页 |