首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于标题特征词密度聚类以及相似度计算的热点发现研究

摘要第1-7页
ABSTRACT第7-12页
第一章 绪论第12-18页
   ·研究的背景和意义第12-13页
   ·国内外研究现状第13-15页
   ·本文的主要工作和论文结构第15-18页
     ·论文的主要研究内容第15-16页
     ·论文的组织结构第16-18页
第二章 热点发现问题中信息预处理的综述第18-33页
   ·提取专题网页集第18-20页
   ·信息预处理第20-23页
     ·分词处理第20-23页
     ·停用词处理第23页
   ·文本特征选取的研究和改进第23-29页
     ·特征词选取方法第23-27页
     ·对特征词选取方法的改进第27-28页
     ·特征词的权重计算第28-29页
   ·文本特征表示第29-32页
     ·布尔模型第30页
     ·概率模型第30-31页
     ·向量空间模型第31-32页
   ·本章小结第32-33页
第三章 热点发现问题中相似度计算的研究第33-37页
   ·文本相似度计算公式第33-34页
   ·改进的相似度计算方案第34-35页
   ·本章小结第35-37页
第四章 热点发现问题中的相关聚类算法分析第37-51页
   ·基于划分的方法第37-38页
   ·基于层次的方法第38-40页
   ·基于网格的方法第40-41页
   ·基于模型的方法第41-42页
   ·基于密度的方法第42-47页
   ·聚类质量评价指标第47-50页
   ·本章小结第50-51页
第五章 基于标题特征词和改进相似度计算方案的密度聚类热点发现算法第51-62页
   ·热点发现算法的总体描述第51-53页
   ·标题特征词选取方法第53-55页
     ·提取文档的有效标题第53-54页
     ·提取有效标题中的特征词第54-55页
   ·结合标题特征词和密度聚类的热点发现算法第55-60页
     ·使用标题特征词一次聚类第55-58页
     ·使用核心文档特征词集二次聚类第58-60页
   ·改进的相似度计算方案第60-61页
   ·本章小结第61-62页
第六章 实验过程与结果分析第62-78页
   ·实验语料及环境第62-63页
     ·实验平台第62页
     ·实验语料第62-63页
   ·标题特征词集与密度聚类算法相结合的实验与分析第63-73页
   ·基于改进的相似度计算方案的热点发现实验与分析第73-77页
   ·本章小结第77-78页
第七章 结论与展望第78-80页
致谢第80-81页
参考文献第81-84页
攻硕期间取得的研究成果第84-85页

论文共85页,点击 下载论文
上一篇:基于主题模型的舆情分析子系统研究与设计
下一篇:多进程软件生存性保障关键技术研究